CN114187263B

CN114187263B - 一种融合先验引导和域适应的磨损表面朗伯反射分离方法

Info

Publication number: CN114187263B
Application number: CN202111508929.1A
Authority: CN
Inventors: 武通海; 胡珂章; 王青华; 王硕
Original assignee: Xian Jiaotong University
Current assignee: Xian Jiaotong University
Priority date: 2021-12-10
Filing date: 2021-12-10
Publication date: 2024-02-06
Anticipated expiration: 2041-12-10
Also published as: CN114187263A

Abstract

一种融合先验引导和域适应的磨损表面朗伯反射分离方法，属于机器设备磨损状态监测领域；首先，构建面向乏样本磨损表面的朗伯反射分离深度网络模型，利用磨损表面已知的基本反射引导从光度图像序列到朗伯图像序列的预测，并通过域适应对齐仿真样本和真实样本两个不同域样本的中间特征，以联合这两种样本优化网络参数；其次，设计图像预测损失函数和域分类损失函数用于联合优化网络模型；再次，构建含标签仿真样本数据集和真实样本数据集；最后，完成网络模型训练并在真实磨损表面上应用；本发明有效地采用先验引导提高少样本下模型的预测精度，并通过域适应实现不同域样本的网络预测一致性，可用于乏样本下复杂反射磨损表面的光度立体精确重建。

Description

一种融合先验引导和域适应的磨损表面朗伯反射分离方法

技术领域

本发明属于机器设备磨损状态监测技术领域，具体涉及一种融合先验引导和域适应的磨损表面朗伯反射分离方法。

背景技术

磨损表面的形貌特征伴随着机械设备磨损过程中的材料降解和去除而产生变化，是设备实时磨损状态信息的载体，因而实施磨损表面形貌监测是进行摩擦副磨损机理分析和故障诊断的重要手段。相较于传统的实验室离线三维形貌获取技术，光度立体视觉方法由二维图像序列重建三维形貌，具有设备小巧便携、像素级采样以及重建细节特征丰富等优点，可以实现磨损表面的原位测量。进一步地，基于获取的三维形貌可以完成磨损表面的综合表征，从而为机械设备部件的磨损故障分析、磨损机理识别以及视情维护提供信息支撑。

光度立体视觉方法获取不同光源照射下的光度图像序列，进而根据图像序列的明暗变化信息求解表面的法向量分布并通过梯度积分重建表面形貌。然而，真实磨损表面成像过程中存在投射阴影、附着阴影和镜面反射等非朗伯反射成分，偏离了传统光度立体方法中待测表面为朗伯表面的假设，这会导致法向量的求解误差。众多光度立体算法已经被开发用来处理非朗伯材料，主要包括解析反射模型、异常值去除和深度学习方法(前两种方法更详细内容可参阅SHI B,MO Z,WU Z,et al.ABenchmark Dataset and Evaluation forNon-Lambertian and Uncalibrated Photometric Stereo[J].IEEE transactions onpattern analysis and machine intelligence,2019,41(2):271–284)。解析反射模型方法通过非线性拟合分析物体表面的双向反射分布函数来描述非朗伯反射，但这种方法原则上需要对不同材料类别进行复杂的个案分析，难以适用于具有多种材质和不同粗糙度的磨损表面；异常值去除方法假设非朗伯成分是局部且稀疏的，可以作为异常值被检测和去除。然而，金属磨损表面的非朗伯异常值可能会非常密集并难以区分；深度学习方法被用于构建由光度图像到法向量或朗伯图像的映射(更详细内容可参阅ZHENG Q,SHI B,PANG.Summary study of data-driven photometric stereo methods[J].Virtual Reality&Intelligent Hardware,2020,2(3):213–221)，其求解精度和泛化能力通常优于前述两种方法。基于深度学习的光度立体算法需要大量的样本作为数据集以进行网络参数训练，但磨损表面真实样本匮乏且难以标定，限制了该方法在磨损表面分析中的应用。尽管图像渲染能够生成大量仿真样本，但由于渲染图像简化成像过程，使得通过仿真样本训练得到的模型不能在真实磨损表面上取得同样良好的预测结果。

总体而言，光度立体视觉方法为基于磨损状态监测的磨损机理分析、故障诊断和机械设备健康管理提供了磨损表面三维形貌原位获取的技术支撑。然而，磨损表面光度图像中多种非朗伯反射成分会导致法向量求解误差，深度学习方法被引入解决该问题，但是其应用过程中面临真实磨损样本匮乏，以及仿真样本相较于真实样本退化的挑战。

发明内容

为了解决上述现有技术的缺陷，本发明的目的在于提供一种融合先验引导和域适应的磨损表面朗伯反射分离方法，首先，构建面向乏样本磨损表面的朗伯反射分离深度网络模型，其利用磨损表面已知的基本反射引导从光度图像序列到朗伯图像序列的预测，并通过域适应对齐仿真样本和真实样本两个不同域样本的中间特征，以联合这两种样本优化网络参数；其次，设计图像预测损失函数和域分类损失函数并构建综合损失函数作为网络模型的优化目标；再次，采用形貌变换与图像渲染技术，以真实的磨损表面形貌为基础构建含标签仿真样本数据集，并通过多光源图像采集系统获取磨损表面光度图像序列作为真实样本数据集；最后，在前述基础上设置合理的训练参数，对网络进行训练，实现磨损表面光度图像的朗伯反射分离。

为了实现上述目的，本发明采用如下技术方案：

一种融合先验引导和域适应的磨损表面朗伯反射分离方法，包括以下步骤：

步骤1：构建由特征预测支路、宏观先验支路和域适应支路组成的磨损表面朗伯反射分离深度学习网络；特征预测支路和宏观先验支路的输出叠加形成磨损表面朗伯图像序列的预测，域适应支路联合真实样本和仿真样本进行网络参数训练，以提高网络在真实磨损样本上的预测准确性；

步骤2：设计面向图像预测的损失函数，并选择二分类交叉熵作为域适应的损失函数，通过加权融合的方式构建网络模型的综合损失函数；

步骤3：构建包含无标签真实样本和含标签仿真样本的训练数据集，其中，无标签真实样本是由多光源图像采集系统获取的磨损表面光度图像序列；含标签仿真样本是在激光共聚焦显微镜获得的真实磨损表面形貌的基础上，采用形貌变换和图像渲染技术生成的；

步骤4：以综合损失函数作为优化目标，不少于800组真实磨损样本和不少于2000含标签仿真样本作为训练集，在每次训练迭代中随机选择仿真样本和真实样本，并采用自适应动量估计(Adam)优化算法训练所构建的磨损表面朗伯反射分离网络模型，实现磨损表面光度图像的朗伯反射分离。

所述步骤1包括如下具体步骤：

S1，构建面向乏样本下磨损表面朗伯反射分离的深度学习网络基本架构，主要包括特征预测支路、宏观先验支路和域适应支路；

S2，特征预测支路由完全对称的编码器和解码器构成，编码器由卷积块和下采样残差块依次组成，下采样残差块中采用卷积层将特征图尺寸减半，以提取深层次的特征信息；解码器由上采样残差块和卷积块依次组成，其中上采样残差块采用反卷积层逐层放大特征图尺寸，以保持输入和输出图像的分辨率一致；下采样残差块和上采样残差块均添加短程连接以构建恒等映射，并引入空间注意力机制以增强磨损特征边缘的预测精度；

S3，宏观先验支路以平面基体作为磨损表面的先验形状进行输入，采用公式(1)所描述的朗伯模型生成不含局部特征的朗伯图像序列，这些图像与特征预测支路的输出相叠加，生成磨损表面的朗伯图像序列；

公式(1)：I_p＝128·(N·L)+128；

式中I_p为像素点p处的图像亮度值；N为像素点p处的单位表面法向量；L为像素点p处光源的单位入射方向向量，具体应用时保持和多光源图像采集系统设置相同；

S4，域适应支路通过构建编码器与域辨识器的对抗学习，确保编码器在不同域样本中特征提取的跨域一致性；域辨识器由梯度反转层和卷积层组成，卷积层用于将从仿真样本和真实磨损样本提取的中间特征图转换为同分辨率的辨识分数图，从而评价域类型并计算域分类损失；梯度反转层用于将反向传播至编码器的域分类损失梯度求反，使网络能够保证在域辨识器最小化域分类损失的同时编码器最大化域分类损失。

所述步骤2包括如下具体步骤：

S1，为了促使训练过程中预测图像接近标签图像，从逐像素的图像亮度值和图像序列中不同图像间的亮度变化幅值两个维度联合设计了图像预测支路的损失函数如公式(2)所示；

公式(2)：

式中m为磨损光度图像序列的图像数量；n为单次迭代输入网络的仿真样本数量；H×W为输入图像的分辨率；分别为第s个样本的第k张图像中像素点p处中朗伯反射图像的预测亮度与真实亮度；/>分别为第s个样本的像素点p处朗伯图像序列的通道间亮度变化幅度的预测值和真实值；

S2，仿真样本和真实磨损样本间的域辨识为二分类问题，故选择二元交叉熵作为域适应的损失函数，如公式(3)所示；

公式(3)：

式中y为域分类标签，仿真样本取0，真实磨损样本取1；为真实磨损样本对应的域辨识分数图F_real在索引(i,j)处的辨识结果；/>为第s个仿真样本对应的域辨识分数图F_s在索引(i,j)处的辨识结果；

S3，对图像预测损失函数和域分类损失函数进行加权融合，进而构建网络模型的综合损失函数为：

公式(4)：L_UDA＝L_est+λ_UDA·L_domain

式中λ_UDA为无监督域适应系数。

所述步骤3包括如下具体步骤：

S1，依靠多光源图像采集系统，在固定视角下逐次切换光源进行拍摄，获取磨损表面光度图像序列作为无标签真实样本；

S2，在激光共聚焦显微镜获得的真实磨损表面形貌的基础上，采用形貌变换和图像渲染技术生成含标签仿真样本，具体包括以下步骤：

(1)利用激光共聚焦显微镜获取磨损表面的三维形貌，并将其表示为高度灰度图；

(2)采用仿射变换从中截取含磨损特征的部分区域，在变换结果中绘制控制网格后给予各个格点随机位移，并采用三次样条插值计算各像素点的高度值，以扩充磨损表面形貌样本；

(3)采用MERL数据库描述仿真表面的反射规律，在Blender渲染软件中设置和多光源图像采集系统相同的光源特性参数和分布信息，对扩充磨损表面进行光度渲染，生成不同材质表面的仿真光度图像序列，并采用公式(1)所述的朗伯模型，生成与仿真光度图像序列相匹配的朗伯图像序列，作为网络训练的预测标签，进而构建含标签仿真样本。

所述步骤4包括如下具体步骤：

S1，以综合损失函数作为优化目标，不少于800组真实磨损样本和不少于20000组含标签仿真样本作为训练集；训练过程中，图像序列的分辨率取128×128，每次参数迭代随机选择10组仿真样本和1组真实样本以平衡样本数目差异；

S2，使用自适应动量估计(Adam)优化算法进行网络的学习，其参数均采用默认值，，并在20-30训练回合(Epoch)线性衰减学习率以避免最优点附近收敛时的震荡；

S3，将训练好的模型参数保存，并输入由多光源图像采集系统采集的磨损表面光度图像序列，得到对应的朗伯图像序列。

本发明具有以下有益效果：

(1)本发明建立了乏样本下磨损表面的朗伯反射分离深度网络模型，实现了复杂反射磨损表面光度图像序列的朗伯反射分离，解决了非朗伯反射成分影响法向量求解准确度的问题，可用于复杂反射磨损表面的精确光度立体重建。

(2)本发明以磨损表面宏观形状的朗伯图像为先验知识，引导网络模型特别关注局部磨损特征导致的朗伯反射变化，简化了朗伯反射分离网络模型的预测任务，可以进一步提高少样本训练条件下网络模型的预测精度。

(3)本发明联合磨损表面仿真样本和真实样本更新网络模型，并采用域适应策略对齐不同域样本的中间特征，促使编码器跨域提取一致特征，进而提高了模型在真实磨损表面上朗伯反射预测的准确度。

附图说明

图1为融合先验引导和域适应的磨损表面朗伯反射分离方法的总体流程图。

图2为朗伯反射分离深度学习网络结构示意图。

图3(a)为编码器中残差块结构示意图。

图3(b)为解码器中残差块结构示意图。

图4(a)为通过激光共聚焦显微镜获得的高度灰度图。

图4(b)为采用仿射变换对高度灰度图进行截取。

图4(c)为对仿射变换后的图像进行可变形变换。

图5(a)为基于形貌变换和图像渲染获得的仿真光度图像序列示例。

图5(b)为生成朗伯图像序列作为仿真光度图像序列的对应标签示例。

图6(a)为采集的真实磨损表面光度图像序列。

图6(b)为训练好的网络模型输出对应的朗伯图像序列。

具体实施方式

下面结合附图，对本发明作进一步说明。

参照图1，一种融合先验引导和域适应的磨损表面朗伯反射分离方法，包括以下步骤：

步骤1：构建由特征预测支路、宏观先验支路和域适应支路组成的磨损表面朗伯反射分离深度学习网络。特征预测支路基于多光路互补原理构建，在编码器与解码器的基础上引入残差块和空间注意力机制；宏观先验支路以磨损表面的先验形状为输入，基于朗伯模型生成不含局部特征的朗伯图像序列，这些图像与特征预测支路的输出叠加生成磨损表面的朗伯图像序列；域适应支路针对渲染光度图像与磨损表面真实光度图像存在的域差异，通过构建面向编码器所提取特征的域辨识器，并联合仿真样本和真实磨损样本以实现域辨识器和编码器的对抗训练，进而优化编码器于渲染图像和真实磨损样本中特征提取的跨域一致性。

所述步骤1包括如下具体步骤：

S1，构建面向乏样本下磨损表面朗伯反射分离的深度学习网络，网络主要由特征预测支路、宏观先验支路和域适应支路组成，如图2所示；

S2，特征预测支路，由完全对称的编码器和解码器构成，用于从光度图像序列中有效分离相应的朗伯反射成分。具体包括以下步骤：

(1)构建由1个卷积块和3个下采样残差块依次组成的编码器，其中卷积块包含一个步长为1的卷积层，输出通道为64。下采样残差块中采用了步长为2的卷积层将特征图尺寸减半，以提取深层次的特征信息，3个下采样残差块中卷积层的输出通道分别为128、256、512，卷积层的卷积核大小为3×3，如图3(a)所示；

(2)构建由3个上采样残差块和1个卷积块依次组成的解码器，其中上采样残差块采用反卷积层逐层放大特征图尺寸，保持输入和输出图像的分辨率一致，3个上采样残差块中反卷积层的输出通道分别为512、256、128，反卷积层的卷积核大小为4×4，如图3(b)所示。卷积块的输出通道为8；

(3)下采样残差块和上采样残差块均添加短程连接以构建恒等映射，并引入空间注意力机制以增强磨损特征边缘的预测精度。空间注意力机制具体实现为沿通道维度提取特征图的最大值和均值分布，并将二者的差值作为权重与特征图相点乘，进而强化亮度显著变化的特征边缘；

S3，宏观先验支路，将基于磨损表面宏观形状渲染的朗伯图像序列作为先验知识，引导模型特别关注局部磨损特征导致的朗伯反射变化，能够提高少样本条件下模型的预测精度。宏观先验支路以平面基体作为磨损表面的先验形状进行输入，采用公式(1)所描述的朗伯模型生成不含局部特征的朗伯图像序列。这些图像与特征预测支路的输出相叠加，生成磨损表面的朗伯图像序列；

公式(1)：I_p＝128·(N·L)+128

式中I_p为像素点p处的图像亮度值；N为像素点p处的单位表面法向量；L为像素点p处光源的单位入射方向向量，具体应用时保持和多光源图像采集系统设置相同。

S4，域适应支路通过构建编码器与域辨识器的对抗学习，优化编码器于仿真样本和真实磨损样本中特征提取的跨域一致性。域辨识器由1层梯度反转层和4层卷积层组成，其中4层卷积层的卷积核为3×3，通道依次为128、32、8、1，用于将从仿真样本和真实磨损样本提取的中间特征图转换为同分辨率的辨识分数图，从而评价域类型并计算域分类损失；梯度反转层用于将反向传播至编码器的域分类损失梯度求反，使网络能够保证在域辨识器最小化域分类损失的同时编码器最大化域分类损失。

步骤2：损失函数用于量化预测结果和真实值之间的差异，并通过梯度反向传播更新网络参数。在步骤1所述的网络模型中，特征预测支路和宏观先验支路的输出叠加形成朗伯图像预测，无监督域适应策略被引入解决不同域样本之间存在的特征差异。为此，分别设计面向图像预测和域适应的损失函数，并构建综合损失函数作为网络的优化目标。

所述步骤2包括如下具体步骤：

S1，在所构建的网络模型中，特征预测支路和宏观先验支路的输出叠加形成朗伯图像序列预测，并根据标签计算图像预测损失以更新模型参数。为了促使训练过程中预测图像接近标签图像，从逐像素的图像亮度值和图像序列中不同图像间的亮度变化幅值两个维度联合设计了图像预测支路的损失函数如公式(2)所示；

公式(2)：

式中m为磨损光度图像序列的图像数量；n为单次迭代输入网络的仿真样本数量；H×W为输入图像的分辨率；分别为第s个样本的第k张图像中像素点p处中朗伯反射图像的预测亮度与真实亮度；/>分别为第s个样本的像素点p处朗伯图像序列的通道间亮度变化幅度的预测值和真实值。

S2，域适应支路采用域分类损失量化域辨识分数图与域标签的差异，并通过梯度反向传播参与优化编码器。仿真样本和真实磨损样本间的域辨识为二分类问题，故选择二元交叉熵损失函数计算域辨识损失，如公式(3)所示；

公式(3)：

式中y为域分类标签，仿真样本取0，真实磨损样本取1；为真实磨损样本对应的域辨识分数图F_real在索引(i,j)处的辨识结果；/>为第s个仿真样本对应的域辨识分数图F_s在索引(i,j)处的辨识结果。

公式(4)：L_UDA＝L_est+λ_UDA·L_domain

式中λ_UDA为无监督域适应系数，其在训练过程中由0渐变至1，以抑制早期训练回合的域辨识器噪声。

步骤3：构建包含无标签真实样本和含标签仿真样本的训练数据集。无标签真实样本是由多光源图像采集系统获取的磨损表面光度图像序列；含标签仿真样本的制作以激光共聚焦显微镜采集的典型磨损特征三维形貌为基础，在利用仿射变换和可变形变换对三维形貌数据进行扩充后，采用MERL数据库和光线追踪法算法生成具有真实材质反射特性的渲染光度图像序列作为样本，并根据朗伯模型生成对应的朗伯图像序列作为标签。

所述步骤3包括如下具体步骤：

S2，在激光共聚焦显微镜获得的真实磨损表面形貌的基础上，采用形貌变换和图像渲染技术生成含标签仿真样本。具体包括以下步骤：

(1)利用奥林巴斯OLS4000激光共聚焦显微镜获取磨损表面的三维形貌，并将其表示为高度灰度图；

(2)采用仿射变换从中截取含磨损特征的部分区域。在变换结果中绘制5×5的控制网格后给予各个格点随机位移，并采用三次样条插值计算各像素点的高度值，以扩充磨损表面形貌样本，具体变换过程如图4所示；

(3)采用MERL数据库描述仿真表面的反射规律，在Blender渲染软件中设置和多光源图像采集系统相同的光源特性参数和分布信息，对扩充磨损表面进行光度渲染，生成不同材质表面的仿真光度图像序列，如图5(a)所示。并采用公式(1)所述的朗伯模型，生成与仿真光度图像序列相匹配的朗伯图像序列，作为网络训练的预测标签，如图5(b)所示。仿真光度图像序列与匹配的朗伯图像序列共同构成含标签仿真样本。

步骤4：以综合损失函数作为优化目标，800组真实磨损样本和20000组含标签仿真样本作为训练集。在每次训练迭代中随机选择10组仿真样本和1组真实样本，并采用自适应动量估计(Adam)优化算法训练所构建的磨损表面朗伯反射分离网络模型，实现磨损表面光度图像的朗伯反射分离。

所述步骤4包括如下具体步骤：

S1，训练过程中，图像序列的分辨率取128×128，每次参数迭代随机选择10组仿真样本和1组真实样本以平衡样本数目差异；

S2，使用自适应动量估计(Adam)优化算法进行网络的学习，其参数均采用默认值。学习率初始值设为0.001，并在20-30训练回合(Epoch)线性衰减学习率以避免最优点附近收敛时的震荡；

S3，将训练好的模型参数保存，并输入由多光源图像采集系统采集的磨损表面光度图像序列，得到对应的朗伯图像序列，实现了磨损表面的朗伯反射分离，如图6所示。进一步，以获得的朗伯图像序列为基础，采用朗伯假设光度立体计算方法，可以精确重建磨损表面。

Claims

1.一种融合先验引导和域适应的磨损表面朗伯反射分离方法，其特征在于，包括以下步骤：

具体包括如下步骤：

S2，特征预测支路由完全对称的编码器和解码器构成；编码器由卷积块和下采样残差块依次组成，下采样残差块中采用卷积层将特征图尺寸减半，以提取深层次的特征信息；解码器由上采样残差块和卷积块依次组成，其中上采样残差块采用反卷积层逐层放大特征图尺寸，以保持输入和输出图像的分辨率一致；下采样残差块和上采样残差块均添加短程连接以构建恒等映射，并引入空间注意力机制以增强磨损特征边缘的预测精度；

S3，宏观先验支路以平面基体作为磨损表面的先验形状进行输入，采用公式(1)所描述的朗伯模型生成不含局部特征的朗伯图像序列；这些图像与特征预测支路的输出相叠加，生成磨损表面的朗伯图像序列；

公式(1)：I_p＝128·(N·L)+128

S4，域适应支路通过构建编码器与域辨识器的对抗学习，确保编码器在不同域样本中特征提取的跨域一致性；域辨识器由梯度反转层和卷积层组成，卷积层用于将从仿真样本和真实磨损样本提取的中间特征图转换为同分辨率的辨识分数图，从而评价域类型并计算域分类损失；梯度反转层用于将反向传播至编码器的域分类损失梯度求反，使网络能够保证在域辨识器最小化域分类损失的同时编码器最大化域分类损失；

步骤4：以综合损失函数作为优化目标，不少于800组真实磨损样本和不少于2000含标签仿真样本作为训练集，在每次训练迭代中随机选择仿真样本和真实样本，并采用自适应动量估计Adam优化算法训练所构建的磨损表面朗伯反射分离网络模型，实现磨损表面光度图像的朗伯反射分离。

2.根据权利要求1所述的一种融合先验引导和域适应的磨损表面朗伯反射分离方法，其特征在于，所述步骤2包括如下具体步骤：

公式(2)：

公式(3)：

公式(4)：L_UDA＝L_est+λ_UDA·L_domain

式中λ_UDA为无监督域适应系数。

3.根据权利要求1所述的一种融合先验引导和域适应的磨损表面朗伯反射分离方法，其特征在于，所述步骤3包括如下具体步骤：

S2，在激光共聚焦显微镜获得的真实磨损表面形貌的基础上，采用形貌变换和图像渲染技术生成含标签仿真样本；具体包括以下步骤：

(2)采用仿射变换从中截取含磨损特征的部分区域；在变换结果中绘制控制网格后给予各个格点随机位移，并采用三次样条插值计算各像素点的高度值，以扩充磨损表面形貌样本；

(3)采用MERL数据库描述仿真表面的反射规律，在Blender渲染软件中设置和多光源图像采集系统相同的光源特性参数和分布信息，对扩充磨损表面进行光度渲染，生成不同材质表面的仿真光度图像序列；并采用公式(1)所述的朗伯模型，生成与仿真光度图像序列相匹配的朗伯图像序列，作为网络训练的预测标签，进而构建含标签仿真样本。

4.根据权利要求1所述的一种融合先验引导和域适应的磨损表面朗伯反射分离方法，其特征在于，所述步骤4包括如下具体步骤：

S2，使用自适应动量估计Adam优化算法进行网络的学习，其参数均采用默认值，学习率初始值设为0.001，并在20-30训练回合Epoch线性衰减学习率以避免最优点附近收敛时的震荡；