CN115588039A - 基于光线自适应对抗学习的光度立体图生成方法及装置 - Google Patents
基于光线自适应对抗学习的光度立体图生成方法及装置 Download PDFInfo
- Publication number
- CN115588039A CN115588039A CN202211588783.0A CN202211588783A CN115588039A CN 115588039 A CN115588039 A CN 115588039A CN 202211588783 A CN202211588783 A CN 202211588783A CN 115588039 A CN115588039 A CN 115588039A
- Authority
- CN
- China
- Prior art keywords
- network
- generation
- convolution layer
- layer
- stereogram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
- G06T7/55—Depth or shape recovery from multiple images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20228—Disparity calculation for image-based rendering
Abstract
本发明公开了一种基于光线自适应对抗学习的光度立体图生成方法及装置,涉及光度立体图生成领域,通过获取不同光照方向下的待测物体的表面图像,并提取其掩膜;构造光线自适应生成对抗网络并进行训练,得到经训练的光线自适应生成对抗网络,光线自适应生成对抗网络包括生成网络和判别网络,判别网络用于在训练过程中对生成网络生成的光度立体图进行判断,并进行反向调节训练;将不同光照方向下的待测物体的表面图像及其掩膜输入经训练的生成网络的光照参数预测部分,预测得到光照方向;将不同光照方向下的待测物体的表面图像及对应光照方向输入经训练的生成网络的光度立体图生成部分,解决光度立体图不够精确问题。
Description
技术领域
本发明涉及光度立体图生成领域,具体涉及一种基于光线自适应对抗学习的光度立体图生成方法及装置。
背景技术
最近,随着深度学习在各种计算机视觉任务中的巨大成功,基于深度学习的方法被引入校准光度立体视觉,其依赖训练和测试期间预定义的一组光线方向生成光度立体图像。
然而,现实生活中更多遇到的是未校准情况下的光度立体问题,需要一种可靠的方法来进行生成光线方向,从而消除繁琐的光源校准的需要。
现有的非校准光度立体成像方法大多采用简化的反射率模型,依赖于额外的线索和参考对象来导出解。而其他直接利用神经网络生成光线方向的方法生成的光线参数估计效果不理想,从而导致生成的光度立体图像不够精确。
发明内容
针对上述提到的技术问题。本申请的实施例的目的在于提出了一种基于光线自适应对抗学习的光度立体图生成方法及装置,来解决以上背景技术部分提到的技术问题。
第一方面,本发明提供了一种基于光线自适应对抗学习的光度立体图生成方法,包括以下步骤:
S1,获取不同光照方向下的待测物体的表面图像,并通过轮廓提取、二值化方法提取表面图像的掩膜;
S2,构造光线自适应生成对抗网络并进行训练,得到经训练的光线自适应生成对抗网络,光线自适应生成对抗网络包括生成网络和判别网络,生成网络包括光照参数预测部分和光度立体图生成部分,判别网络用于在训练过程中对生成网络生成的光度立体图进行判断,并进行反向调节训练;
S3,将不同光照方向下的待测物体的表面图像及其掩膜输入经训练的生成网络的光照参数预测部分,预测得到光照方向;
S4,将不同光照方向下的待测物体的表面图像及对应光照方向输入经训练的生成网络的光度立体图生成部分,得到生成光度立体图。
作为优选,光照参数预测部分包括依次连接的第一特征提取模块、第一融合模块和光参数估计子网络,第一特征提取模块分别对每个光照方向下的待测物体的表面图像及其掩膜进行特征提取,得到多个局部特征;将多个局部特征输入第一融合模块进行聚合,得到全局特征,将多个局部特征和全局特征连接,得到拼接特征,将拼接特征输入光参数估计子网络,预测得到每个表面图像的光照方向。
作为优选,第一特征提取模块包括依次连接的第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、第六卷积层和第七卷积层,第一卷积层和第二卷积层的卷积核大小为3×3、步长为1,第三卷积层、第四卷积层的卷积核大小为1×1、步长为1,第五卷积层、第六卷积层和第七卷积层的卷积核大小为3×3、步长为2,第一融合模块为最大池化层,光参数估计子网络包括依次连接的第八卷积层、第九卷积层、第十卷积层、第十一卷积层、第十二卷积层、第一全连接层和第二全连接层,用于生成光线方向,第八卷积层、第九卷积层和第十卷积层的卷积核大小为3×3、步长为1,第十一卷积层和第十二卷积层的卷积核大小为3×3、步长为2,第一全连接层和第二全连接层的节点数分别为64、3。
作为优选,光度立体图生成部分包括第二特征提取模块、第二融合模块和回归模块,第二特征提取模块分别对不同光照方向下的待测物体的表面图像进行特征提取,得到多个图像特征;将多个图像特征输入第二融合模块中进行融合,得到融合后的特征;将融合后的特征输入回归模块中进行光度立体图回归,得到待测物体的光度立体图。
作为优选,第二特征提取模块包括依次连接的第十三卷积层、第十四卷积层、第一残差结构、第二残差结构和第一反卷积层,第十三卷积层和第十四卷积层的卷积核大小为3×3,第一反卷积层的步长为2、卷积核大小为3×3,第一残差结构和第二残差结构之间设有第十五卷积层,第十五卷积层的步长为2、卷积核大小为3×3,用于完成下采样的操作,第一残差结构和第二残差结构包括依次连接的第十六卷积层和第十七卷积层,第十六卷积层的卷积核大小为1×1,第十七卷积层的卷积核大小为3×3,并且第十七卷积层的输出特征通过残差连接与第十六卷积层的输入特征融合,第二融合模块为最大池化层,回归模块包括依次连接的第十八卷积层、第十九卷积层、第二十卷积层、第二反卷积层以及第二十一卷积层,用于生成光度立体图,第十八卷积层、第十九卷积层和第二十卷积层的卷积核大小为3×3、步长为1,第二反卷积层的卷积核大小为3×3、步长为2,第二十一卷积层的卷积核大小为3×3、步长为1、卷积核数目为3。
作为优选,判别网络为五层全连接网络,每层节点数从输入到输出依次为8、128、64、32、1。
作为优选,光线自适应生成对抗网络的训练过程如下:
其中,N生成为生成光度立体图,N真实为真实光度立体图;
S22,将训练数据中的不同光照方向下的待测物体的表面图像及其掩膜输入生成
网络,得到虚假样本;将真实光度立体图作为真实样本;将真实样本与虚假样本同时输入判
别网络进行判别训练,得到第一生成标签与第一样本标签,尽可能区分真假样本,判别训练
损失函数为:
S24,重复步骤S22-S23,直至纳什均衡。
第二方面,本发明提供了一种基于光线自适应对抗学习的光度立体图生成装置,包括:
图像获取模块,被配置为获取不同光照方向下的待测物体的表面图像,并通过轮廓提取、二值化方法提取表面图像的掩膜;
网络构造训练模块,被配置为构造光线自适应生成对抗网络并进行训练,得到经训练的光线自适应生成对抗网络,光线自适应生成对抗网络包括生成网络和判别网络,生成网络包括光照参数预测部分和光度立体图生成部分,判别网络用于在训练过程中对生成网络生成的光度立体图进行判断,并进行反向调节训练;
参数预测模块,被配置为将不同光照方向下的待测物体的表面图像及其掩膜输入经训练的生成网络的光照参数预测部分,预测得到光照方向;
图像生成模块,被配置为将不同光照方向下的待测物体的表面图像及对应光照方向输入经训练的生成网络的光度立体图生成部分,得到生成光度立体图。
第三方面,本发明提供了一种电子设备,包括一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
相比于现有技术,本发明具有以下有益效果:
(1)本发明利用现有数据集生成新的数据集,得到更加多样的样本集,增强了网络的鲁棒性;
(2)本发明中结合对抗网络训练生成网络,以微调光照方向,从而得到更加精确的光度立体图;
(3)本发明将对抗网络与光度立体视觉技术结合,为解决未校准的光度立体视觉问题提供了新的方法思路,同时可进一步用于光度立体图的缺陷检测和缺陷识别。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请的一个实施例可以应用于其中的示例性装置架构图;
图2为本申请的实施例的基于光线自适应对抗学习的光度立体图生成方法的流程示意图;
图3为本申请的实施例的基于光线自适应对抗学习的光度立体图生成方法的光线自适应生成对抗网络的生成网络的结构示意图;
图4为本申请的实施例的基于光线自适应对抗学习的光度立体图生成方法的光线自适应生成对抗网络的判别网络的结构示意图;
图5为本申请的实施例的基于光线自适应对抗学习的光度立体图生成装置的示意图;
图6是适于用来实现本申请实施例的电子设备的计算机装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1示出了可以应用本申请实施例的基于光线自适应对抗学习的光度立体图生成方法或基于光线自适应对抗学习的光度立体图生成装置的示例性装置架构100。
如图1所示,装置架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种应用,例如数据处理类应用、文件处理类应用等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上传的文件或数据进行处理的后台数据处理服务器。后台数据处理服务器可以对获取的文件或数据进行处理,生成处理结果。
需要说明的是,本申请实施例所提供的基于光线自适应对抗学习的光度立体图生成方法可以由服务器105执行,也可以由终端设备101、102、103执行,相应地,基于光线自适应对抗学习的光度立体图生成装置可以设置于服务器105中,也可以设置于终端设备101、102、103中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。在所处理的数据不需要从远程获取的情况下,上述装置架构可以不包括网络,而只需服务器或终端设备。
图2示出了本申请的实施例提供的一种基于光线自适应对抗学习的光度立体图生成方法,包括以下步骤:
S1,获取不同光照方向下的待测物体的表面图像,并通过轮廓提取、二值化方法提取表面图像的掩膜。
具体的,采集同一物体在多个光照方向下的表面图像,并通过轮廓提取、二值化方法获取该表面图像的掩膜。
S2,构造光线自适应生成对抗网络并进行训练,得到经训练的光线自适应生成对抗网络,光线自适应生成对抗网络包括生成网络和判别网络,生成网络包括光照参数预测部分和光度立体图生成部分,判别网络用于在训练过程中对生成网络生成的光度立体图进行判断,并进行反向调节训练。
在具体的实施例中,光照参数预测部分包括依次连接的第一特征提取模块、第一融合模块和光参数估计子网络,第一特征提取模块分别对每个光照方向下的待测物体的表面图像及其掩膜进行特征提取,得到多个局部特征;将多个局部特征输入第一融合模块进行聚合,得到全局特征,将多个局部特征和全局特征连接,得到拼接特征,将拼接特征输入光参数估计子网络,预测得到每个表面图像的光照方向。第一特征提取模块包括依次连接的第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、第六卷积层和第七卷积层,第一卷积层和第二卷积层的卷积核大小为3×3、步长为1,第三卷积层、第四卷积层的卷积核大小为1×1、步长为1,第五卷积层、第六卷积层和第七卷积层的卷积核大小为3×3、步长为2,第一融合模块为最大池化层,光参数估计子网络包括依次连接的第八卷积层、第九卷积层、第十卷积层、第十一卷积层、第十二卷积层、第一全连接层和第二全连接层,用于生成光线方向,第八卷积层、第九卷积层和第十卷积层的卷积核大小为3×3、步长为1,第十一卷积层和第十二卷积层的卷积核大小为3×3、步长为2,第一全连接层和第二全连接层的节点数分别为64、3。
具体的,以同一物体多个光照方向的表面图像及其掩模作为输入,输出光照方向。将不同光照方向下的待测物体的表面图像及其掩模分别输入到一个权值共享的第一特征提取模块,生成局部特征;通过最大池化层将输入图像的所有局部特征聚合为一个全局特征;将每个局部特征与全局特征连接,并输入共享权重的光参数估计子网络,以预测每个表面图像的光照方向。
在具体的实施例中,光度立体图生成部分包括第二特征提取模块、第二融合模块和回归模块,第二特征提取模块分别对不同光照方向下的待测物体的表面图像进行特征提取,得到多个图像特征;将多个图像特征输入第二融合模块中进行融合,得到融合后的特征;将融合后的特征输入回归模块中进行光度立体图回归,得到待测物体的光度立体图。第二特征提取模块包括依次连接的第十三卷积层、第十四卷积层、第一残差结构、第二残差结构和第一反卷积层,第十三卷积层和第十四卷积层的卷积核大小为3×3,第一反卷积层的步长为2、卷积核大小为3×3,第一残差结构和第二残差结构之间设有第十五卷积层,第十五卷积层的步长为2、卷积核大小为3×3,用于完成下采样的操作,第一残差结构和第二残差结构包括依次连接的第十六卷积层和第十七卷积层,第十六卷积层的卷积核大小为1×1,第十七卷积层的卷积核大小为3×3,并且第十七卷积层的输出特征通过残差连接与第十六卷积层的输入特征融合,第二融合模块为最大池化层,回归模块包括依次连接的第十八卷积层、第十九卷积层、第二十卷积层、第二反卷积层以及第二十一卷积层,用于生成光度立体图,第十八卷积层、第十九卷积层和第二十卷积层的卷积核大小为3×3、步长为1,第二反卷积层的卷积核大小为3×3、步长为2,第二十一卷积层的卷积核大小为3×3、步长为1、卷积核数目为3。
具体的,利用卷积对同一物体多个光照方向的表面图像及对应光线方向进行特征提取,通过共享卷积实现特征匹配;通过最大池化层,对不同光照方向的表面图像的局部特征进行融合,提取全局特征;对融合后的特征图进行光度图回归以生成精细的光度立体图。
在具体的实施例中,判别网络为五层全连接网络,每层节点数从输入到输出依次为8、128、64、32、1。随机初始化各个节点参数,得到初始化的对抗网络。训练的结果,判别网络对于真假样本概率输出均为0.5。即对于真假样本,判别模型输出两种标签的概率一致,无法判别该光度立体图是经过光线自适应生成对抗网络的生成网络生成的图像还是未经过光线自适应生成对抗网络生成的图像,光线估计达到了最佳值。
在具体的实施例中,光线自适应生成对抗网络的训练过程如下:
其中,L生成为生成光照方向,L真实为真实光照方向;
其中,N生成为生成光度立体图,N真实为真实光度立体图;
S22,将训练数据中的不同光照方向下的待测物体的表面图像及其掩膜输入生成
网络,得到虚假样本;将真实光度立体图作为真实样本;将真实样本与虚假样本分别输入判
别网络进行判别训练,得到第一生成标签与第一样本标签,尽可能区分真假样本,判别训练
损失函 数为:
S24,重复步骤S22-S23,直至纳什均衡。
具体的,本申请的实施例的训练数据的构建过程为:
使用来自两个现有3D数据集的形状,即Blobby数据集和Sculpture数据集,使用基于物理的射线跟踪器生成训练数据。使用MERL数据集,其中包含100个真实世界材料的不同BRDF,来定义不同的表面材料集来渲染这些形状。数据集在渲染时显式地考虑投射阴影。
首先使用Blobby数据集生成训练数据,它包含10个具有不同正态分布的斑点形状。对于每个斑点形状,使用1296个常规采样视图(其中包括36个方位角和 36个仰角),对于每个视图,在100个BRDF中随机选择2个,生成25920个样本。对于每个样本,本申请的实施例渲染了64幅空间分辨率为128×128的图像,在180°×180°范围内随机抽样,最后将训练数据随机分成99:1进行训练和验证。
Blobby数据集中的表面通常是平滑的,缺乏细节。为了给训练提供更复杂真实的正态分布,本申请的实施例从引入的Sculpture数据集中选取了8个复杂的3D模型,以完全相同的方式为Sculpture数据集生成样本。渲染的图像尺寸为512×512。然后,从渲染的图像中剪裁尺寸为128×128的图像,并丢弃那些前景比例小于50%的图像,生成一个包含59292个样本的数据集,每个样本包含64张在不同光线方向下渲染的图像。最后,将训练数据随机分成99:1进行训练和验证。
S3,将不同光照方向下的待测物体的表面图像及其掩膜输入经训练的生成网络的光照参数预测部分,预测得到光照方向。
具体的,将同一物体多个光照方向的表面图片和掩膜输入到前一步生成参数固定的生成网络的光照参数预测部分,预测得到光照方向。
S4,将不同光照方向下的待测物体的表面图像及对应光照方向输入经训练的生成网络的光度立体图生成部分,得到生成光度立体图。
具体的,将同一物体多个光照方向的表面图及预测出的光照方向输入生成网络的光度立体图生成部分,得到未校准光源下精确的光度立体图。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种基于光线自适应对抗学习的光度立体图生成装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
本申请实施例提供了一种基于光线自适应对抗学习的光度立体图生成装置,包括:
图像获取模块1,被配置为获取不同光照方向下的待测物体的表面图像,并通过轮廓提取、二值化方法提取表面图像的掩膜;
网络构造训练模块2,被配置为构造光线自适应生成对抗网络并进行训练,得到经训练的光线自适应生成对抗网络,光线自适应生成对抗网络包括生成网络和判别网络,生成网络包括光照参数预测部分和光度立体图生成部分,判别网络用于在训练过程中对生成网络生成的光度立体图进行判断,并进行反向调节训练;
参数预测模块3,被配置为将不同光照方向下的待测物体的表面图像及其掩膜输入经训练的生成网络的光照参数预测部分,预测得到光照方向;
图像生成模块4,被配置为将不同光照方向下的待测物体的表面图像及对应光照方向输入经训练的生成网络的光度立体图生成部分,得到生成光度立体图。
下面参考图6,其示出了适于用来实现本申请实施例的电子设备(例如图1所示的服务器或终端设备)的计算机装置600的结构示意图。图6示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机装置600包括中央处理单元(CPU)601和图形处理器(GPU)602,其可以根据存储在只读存储器(ROM)603中的程序或者从存储部分609加载到随机访问存储器(RAM)604中的程序而执行各种适当的动作和处理。在RAM 604中,还存储有装置600操作所需的各种程序和数据。CPU 601、GPU602、ROM 603以及RAM 604通过总线605彼此相连。输入/输出(I/O)接口606也连接至总线605。
以下部件连接至I/O接口606:包括键盘、鼠标等的输入部分607;包括诸如、液晶显示器(LCD)等以及扬声器等的输出部分608;包括硬盘等的存储部分609;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分610。通信部分610经由诸如因特网的网络执行通信处理。驱动器611也可以根据需要连接至I/O接口606。可拆卸介质612,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器611上,以便于从其上读出的计算机程序根据需要被安装入存储部分609。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分610从网络上被下载和安装,和/或从可拆卸介质612被安装。在该计算机程序被中央处理单元(CPU)601和图形处理器(GPU)602执行时,执行本申请的方法中限定的上述功能。
需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。计算机可读介质例如可以是——但不限于——电、磁、光、电磁、红外线或半导体的装置、装置或器件,或者任意以上的组合。计算机可读介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件或者上述的任意合适的组合。在本申请中,计算机可读介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行装置、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行装置、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,也可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,该模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的装置来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取不同光照方向下的待测物体的表面图像,并通过轮廓提取、二值化方法提取表面图像的掩膜;构造光线自适应生成对抗网络并进行训练,得到经训练的光线自适应生成对抗网络,光线自适应生成对抗网络包括生成网络和判别网络,生成网络包括光照参数预测部分和光度立体图生成部分,判别网络用于在训练过程中对生成网络生成的光度立体图进行判断,并进行反向调节训练;将不同光照方向下的待测物体的表面图像及其掩膜输入经训练的生成网络的光照参数预测部分,预测得到光照方向;将不同光照方向下的待测物体的表面图像及对应光照方向输入经训练的生成网络的光度立体图生成部分,得到生成光度立体图。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种基于光线自适应对抗学习的光度立体图生成方法,其特征在于,包括以下步骤:
S1,获取不同光照方向下的待测物体的表面图像,并通过轮廓提取、二值化方法提取表面图像的掩膜;
S2,构造光线自适应生成对抗网络并进行训练,得到经训练的光线自适应生成对抗网络,所述光线自适应生成对抗网络包括生成网络和判别网络,所述生成网络包括光照参数预测部分和光度立体图生成部分,所述判别网络用于在训练过程中对所述生成网络生成的光度立体图进行判断,并进行反向调节训练;
S3,将所述不同光照方向下的待测物体的表面图像及其掩膜输入经训练的生成网络的所述光照参数预测部分,预测得到光照方向;
S4,将不同光照方向下的待测物体的表面图像及对应光照方向输入经训练的生成网络的所述光度立体图生成部分,得到生成光度立体图。
2.根据权利要求1所述的基于光线自适应对抗学习的光度立体图生成方法,其特征在于,所述光照参数预测部分包括依次连接的第一特征提取模块、第一融合模块和光参数估计子网络,所述第一特征提取模块分别对每个光照方向下的待测物体的表面图像及其掩膜进行特征提取,得到多个局部特征;将所述多个局部特征输入第一融合模块进行聚合,得到全局特征,将所述多个局部特征和所述全局特征连接,得到拼接特征,将所述拼接特征输入所述光参数估计子网络,预测得到每个表面图像的光照方向。
3.根据权利要求2所述的基于光线自适应对抗学习的光度立体图生成方法,其特征在于,所述第一特征提取模块包括依次连接的第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、第六卷积层和第七卷积层,所述第一卷积层和第二卷积层的卷积核大小为3×3、步长为1,所述第三卷积层、第四卷积层的卷积核大小为1×1、步长为1,所述第五卷积层、第六卷积层和第七卷积层的卷积核大小为3×3、步长为2,所述第一融合模块为最大池化层,所述光参数估计子网络包括依次连接的第八卷积层、第九卷积层、第十卷积层、第十一卷积层、第十二卷积层、第一全连接层和第二全连接层,用于生成光线方向,所述第八卷积层、第九卷积层和第十卷积层的卷积核大小为3×3、步长为1,所述第十一卷积层和第十二卷积层的卷积核大小为3×3、步长为2,第一全连接层和第二全连接层的节点数分别为64、3。
4.根据权利要求1所述的基于光线自适应对抗学习的光度立体图生成方法,其特征在于,所述光度立体图生成部分包括第二特征提取模块、第二融合模块和回归模块,所述第二特征提取模块分别对所述不同光照方向下的待测物体的表面图像进行特征提取,得到多个图像特征;将所述多个图像特征输入所述第二融合模块中进行融合,得到融合后的特征;将所述融合后的特征输入所述回归模块中进行光度立体图回归,得到所述待测物体的光度立体图。
5.根据权利要求4所述的基于光线自适应对抗学习的光度立体图生成方法,其特征在于,所述第二特征提取模块包括依次连接的第十三卷积层、第十四卷积层、第一残差结构、第二残差结构和第一反卷积层,所述第十三卷积层和第十四卷积层的卷积核大小为3×3,所述第一反卷积层的步长为2、卷积核大小为3×3,所述第一残差结构和所述第二残差结构之间设有第十五卷积层,所述第十五卷积层的步长为2、卷积核大小为3×3,用于完成下采样的操作,所述第一残差结构和所述第二残差结构包括依次连接的第十六卷积层和第十七卷积层,所述第十六卷积层的卷积核大小为1×1,所述第十七卷积层的卷积核大小为3×3,并且所述第十七卷积层的输出特征通过残差连接与所述第十六卷积层的输入特征融合,所述第二融合模块为最大池化层,所述回归模块包括依次连接的第十八卷积层、第十九卷积层、第二十卷积层、第二反卷积层以及第二十一卷积层,用于生成光度立体图,所述第十八卷积层、第十九卷积层和第二十卷积层的卷积核大小为3×3、步长为1,所述第二反卷积层的卷积核大小为3×3、步长为2,所述第二十一卷积层的卷积核大小为3×3、步长为1、卷积核数目为3。
6.根据权利要求1所述的基于光线自适应对抗学习的光度立体图生成方法,其特征在于,所述判别网络为五层全连接网络,每层节点数从输入到输出依次为8、128、64、32、1。
7.根据权利要求1所述的基于光线自适应对抗学习的光度立体图生成方法,其特征在于,所述光线自适应生成对抗网络的训练过程如下:
其中,L生成为生成光照方向,L真实为真实光照方向;
其中,N生成为生成光度立体图,N真实为真实光度立体图;
S22,将训练数据中的不同光照方向下的待测物体的表面图像及其掩膜输入生成网络,
得到虚假样本;将真实光度立体图作为真实样本;将真实样本与虚假样本同时输入所述判
别网络进行判别训练,得到第一生成标签与第一样本标签,尽可能区分真假样本,判别训练
损失函数为:
S23,输入到所述生成网络产生虚假样本,更改该虚假样本标签后输入到所述判别网络
进行判别,固定所述判别网络的参数,调整所述生成网络的所述光照参数预测部分的参数
使得生成尽可能真的虚假样本,所述生成网络的损失函数为:
S24,重复步骤S22-S23,直至纳什均衡。
8.一种基于光线自适应对抗学习的光度立体图生成装置,其特征在于,包括:
图像获取模块,被配置为获取不同光照方向下的待测物体的表面图像,并通过轮廓提取、二值化方法提取表面图像的掩膜;
网络构造训练模块,被配置为构造光线自适应生成对抗网络并进行训练,得到经训练的光线自适应生成对抗网络,所述光线自适应生成对抗网络包括生成网络和判别网络,所述生成网络包括光照参数预测部分和光度立体图生成部分,所述判别网络用于在训练过程中对所述生成网络生成的光度立体图进行判断,并进行反向调节训练;
参数预测模块,被配置为将所述不同光照方向下的待测物体的表面图像及其掩膜输入经训练的生成网络的所述光照参数预测部分,预测得到光照方向;
图像生成模块,被配置为将不同光照方向下的待测物体的表面图像及对应光照方向输入经训练的生成网络的所述光度立体图生成部分,得到生成光度立体图。
9.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211588783.0A CN115588039B (zh) | 2022-12-12 | 2022-12-12 | 基于光线自适应对抗学习的光度立体图生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211588783.0A CN115588039B (zh) | 2022-12-12 | 2022-12-12 | 基于光线自适应对抗学习的光度立体图生成方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115588039A true CN115588039A (zh) | 2023-01-10 |
CN115588039B CN115588039B (zh) | 2023-05-30 |
Family
ID=84783392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211588783.0A Active CN115588039B (zh) | 2022-12-12 | 2022-12-12 | 基于光线自适应对抗学习的光度立体图生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115588039B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105303185A (zh) * | 2015-11-27 | 2016-02-03 | 中国科学院深圳先进技术研究院 | 虹膜定位方法及装置 |
US20200134773A1 (en) * | 2018-10-27 | 2020-04-30 | Gilbert Pinter | Machine vision systems, illumination sources for use in machine vision systems, and components for use in the illumination sources |
CN111353449A (zh) * | 2020-03-03 | 2020-06-30 | 南京理工大学 | 基于条件生成对抗网络的红外道路图像水体检测方法 |
US20200265590A1 (en) * | 2019-02-19 | 2020-08-20 | The Trustees Of The University Of Pennsylvania | Methods, systems, and computer readable media for estimation of optical flow, depth, and egomotion using neural network trained using event-based learning |
CN111798400A (zh) * | 2020-07-20 | 2020-10-20 | 福州大学 | 基于生成对抗网络的无参考低光照图像增强方法及系统 |
-
2022
- 2022-12-12 CN CN202211588783.0A patent/CN115588039B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105303185A (zh) * | 2015-11-27 | 2016-02-03 | 中国科学院深圳先进技术研究院 | 虹膜定位方法及装置 |
US20200134773A1 (en) * | 2018-10-27 | 2020-04-30 | Gilbert Pinter | Machine vision systems, illumination sources for use in machine vision systems, and components for use in the illumination sources |
US20200265590A1 (en) * | 2019-02-19 | 2020-08-20 | The Trustees Of The University Of Pennsylvania | Methods, systems, and computer readable media for estimation of optical flow, depth, and egomotion using neural network trained using event-based learning |
CN111353449A (zh) * | 2020-03-03 | 2020-06-30 | 南京理工大学 | 基于条件生成对抗网络的红外道路图像水体检测方法 |
CN111798400A (zh) * | 2020-07-20 | 2020-10-20 | 福州大学 | 基于生成对抗网络的无参考低光照图像增强方法及系统 |
Non-Patent Citations (3)
Title |
---|
HAO LIANG ET.AL.: "Photometric Stereo with Only Two Images: A Generative Approach", 《2019 2ND IEEE INTERNATIONAL CONFERENCE ON INFORMATION COMMUNICATION AND SIGNAL PROCESSING》 * |
LILI LIN ET.AL.: "Rigid-aware self-supervised GAN for camera ego-motion estimation", 《DIGITAL SIGNAL PROCESSING》 * |
许丽: "非郎伯体的高光去除和光度立体重建研究", 《中国优秀硕士学位论文全文数据库 (基础科学辑)》 * |
Also Published As
Publication number | Publication date |
---|---|
CN115588039B (zh) | 2023-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108427939B (zh) | 模型生成方法和装置 | |
JP7372010B2 (ja) | 深層学習システム | |
CN111476309B (zh) | 图像处理方法、模型训练方法、装置、设备及可读介质 | |
CN108520220B (zh) | 模型生成方法和装置 | |
WO2018166438A1 (zh) | 图像处理方法、装置及电子设备 | |
CN108235116B (zh) | 特征传播方法和装置、电子设备和介质 | |
CN110632608B (zh) | 一种基于激光点云的目标检测方法和装置 | |
CN109344752B (zh) | 用于处理嘴部图像的方法和装置 | |
CN111414879B (zh) | 人脸遮挡程度识别方法、装置、电子设备及可读存储介质 | |
CN111915480B (zh) | 生成特征提取网络的方法、装置、设备和计算机可读介质 | |
CN111524216A (zh) | 生成三维人脸数据的方法和装置 | |
CN108470179B (zh) | 用于检测对象的方法和装置 | |
CN112712036A (zh) | 交通标志识别方法、装置、电子设备及计算机存储介质 | |
CN115656189B (zh) | 基于光度立体与深度学习算法的缺陷检测方法及装置 | |
CN114266937A (zh) | 模型训练、图像处理方法,装置,设备以及存储介质 | |
CN111967332B (zh) | 用于自动驾驶的能见度信息生成方法和装置 | |
CN115588039B (zh) | 基于光线自适应对抗学习的光度立体图生成方法及装置 | |
CN108256477B (zh) | 一种用于检测人脸的方法和装置 | |
US11935177B2 (en) | Ray tracing using reservoir resampling with spatial shift-mapping | |
CN115880526A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN112597788B (zh) | 目标测定方法、装置、电子设备和计算机可读介质 | |
CN112070888B (zh) | 图像生成方法、装置、设备和计算机可读介质 | |
CN116704593A (zh) | 预测模型训练方法、装置、电子设备和计算机可读介质 | |
CN110119721B (zh) | 用于处理信息的方法和装置 | |
CN113744379A (zh) | 图像生成方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |