CN112862811A

CN112862811A - 基于深度学习的材料显微图像缺陷识别方法、设备及装置

Info

Publication number: CN112862811A
Application number: CN202110259892.7A
Authority: CN
Inventors: 曹元成; 徐佐; 沙武鑫; 朱志华; 武汉琦; 程丹芃; 曹志成
Original assignee: Huazhong University of Science and Technology; CITIC Dicastal Co Ltd
Current assignee: Huazhong University of Science and Technology; CITIC Dicastal Co Ltd
Priority date: 2021-03-10
Filing date: 2021-03-10
Publication date: 2021-05-28
Anticipated expiration: 2041-03-10
Also published as: CN112862811B

Abstract

本发明提供了一种基于深度学习的材料显微图像缺陷识别方法、设备及装置。首先采用分类标记对获取的材料结构显微图像进行缺陷标注；然后利用仿射变换将样本图片集分割形成训练集；接着利用含有分类标注的训练集对预先构建的缺陷识别模型进行训练；最后利用训练好的缺陷识别模型对待识别缺陷样本进行缺陷检测，获得目标缺陷样本中的缺陷类别与位置。本发明采用分类标注的方法对缺陷图像进行标注，并综合卷积神经网络模型、区域生成模型和语义分割模型，从而实现高精度的图像分割和识别，提高缺陷识别的速度和精度，有助于推动合金工业的智能化进展，加速第四次工业革命在金属铸造行业的应用。

Description

基于深度学习的材料显微图像缺陷识别方法、设备及装置

技术领域

本发明涉及图像识别技术技术领域，尤其涉及一种基于深度学习的材料显微图像缺陷识别方法、设备及装置。

背景技术

合金产品已广泛应用于交通运输、航空航天、建筑制造等各个领域，在生产生活中的需求量巨大。虽然铝合金的制造加工工艺已经相当成熟，但是多变的使用和加工环境为合金的规模化制造带来了挑战。通过先进的表征手段探测铸造产品内部的状态和缺陷，并采取对应的调整措施，可以挽回大量的经济损失，并大大提高生产效率。因此，及时、准确并批量的分析出合金的内在状态并反馈给铸造工艺系统，对于现代智能制造来说至关重要。

由于合金的宏观力学性质在很大程度上取决于微观组织的组成和结构，因此常常采用显微谱图进行表征。金相图像分析是金属材料微观结构的重要工具。金相图像的自动化处理将为整个合金铸造行业带了巨大效益。幸运的是，先进的深度学习算法，超强并行计算架构和大量的训练数据在图像处理上获得了巨大的成功。这些方法可以巧妙地嫁接在显微金属图像的处理上，实现显微金属图像的自动处理、分类和定量统计，进一步加快金属铸造行业的智能化。然而，现有的图像处理方法对显微图像的识别精度和速度还有待提高。

有鉴于此，有必要设计一种改进的基于深度学习的材料显微图像缺陷识别方法，以解决上述问题。

发明内容

为了克服上述现有技术中精度低、速度慢等不足，本发明的目的在于提供一种基于深度学习的材料显微图像缺陷识别方法、设备及装置。

为实现上述发明目的，本发明提供了一种基于深度学习的材料显微图像缺陷识别方法，包括：

获取待识别图像；

将所述待识别图像分割成若干预设大小的图像子块，输入到预先训练好的缺陷识别模型，得到待识别图像的缺陷信息；

其中，所述缺陷识别模型包括：

卷积神经网络模型，用于提取图像特征集合以及预测得分；

区域生成模型，用于确定缺陷位置信息；

和语义分割模型，用于确定缺陷类别信息。

作为本发明的进一步改进，所述缺陷识别模型的训练方法包括如下步骤：

S1.获取若干显微图像，并对所述显微图像的缺陷类别和缺陷位置进行分类标注；将含有一或多个缺陷的显微图像通过仿射变换分割成按预设权重配比的训练集；

S2.利用所述训练集对预配置权重的缺陷识别模型进行训练。

作为本发明的进一步改进，所述训练方法包括：

按显微图像缺陷信息分配训练集权重，将所述训练集输入构建的所述卷积神经网络模型；

使用预配置权重的缺陷识别模型进行权重迁移；

收集所述卷积神经网络模型最后一个卷积层输出的特征图，ROI Align层将多尺度特征图转化为相同尺寸，全连接层对特征图实现缺陷分类与回归，mask层实现语义分割。

作为本发明的进一步改进，所述缺陷识别模型训练采用的损失函数为：

L＝L_cls+L_box+L_mask

式中，L_cls为分类损失，L_box为框的回归损失，L_mask为掩码损失。

作为本发明的进一步改进，所述语义分割模型的损失函数为：

其中，M表示类别数量；y_c是指示变量(0或1)，如果该类别和样本的类别相同就是1，否则是0；p_c代表观测样本属于c类别的预测概率。

作为本发明的进一步改进，所述训练方法包括：

coco.h文件作为缺陷预设权重，利用随机高斯过程设置所述卷积神经网络模型的内参数；所述卷积神经网络模型接收上次训练返回的loss值对参数进行调整，将输入图像进行操作，提取出多组不同尺度的特征图；

所述多组不同尺度的特征图经ROI Align层调整为统一尺度的特征图，输入所述区域生成模型，判断缺陷位置信息；

最后，经所述语义分割模型判断缺陷类别信息，画出掩膜，输出图像，并与所述训练集的图像比较，计算出class、box、mask三种loss值，然后返回至所述卷积神经网络模型，重复上述步骤。

作为本发明的进一步改进，在步骤S1中，所述分类标注的方法为包围框标注；所述仿射变换是将图像边界进行灰度填充后，再进行旋转、缩放、翻转，以丰富图像集。

为实现上述发明目的，本发明还提供了一种基于深度学习的图像缺陷识别模型训练装置，其特征在于，包括：

图像获取模块，用于获取若干显微图像，并对所述显微图像进行陷类型与缺陷位置的标注；

训练集生成模块，用于经仿射变换丰富图像集，将含有标注的显微图像分割成若干大小的图像子块，子块形成训练集；

模型训练模块，用于利用所述训练集对预先构建的缺陷识别模型进行训练，所述缺陷识别模型包括卷积神经网络模型、区域生成模型和语义分割模型；在所述训练过程中，所述卷积神经网络模型的输入为所述训练集，所述区域生成模型的输入为所述训练集以及所述卷积神经网络模型的输出，所述语义分割模型的输入为所述区域生成模型的输出。

为实现上述发明目的，本发明还提供了一种基于深度学习的显微图像缺陷识别装置，其特征在于，包括：

数据输入模块，用于获取待识别图像；

图像处理模块，用于将所述待识别图像分割成若干预设大小的图像子块，

缺陷识别模块，用于将所述图像子块输入训练好的缺陷识别模型中进行缺陷识别，获得所述待识别显微图像的缺陷类别以及缺陷位置信息。

为实现上述发明目的，本发明还提供了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时，执行权利要求1至6中任一项所述的基于深度学习的材料显微图像缺陷识别方法。

本发明的有益效果是：

1.本发明提供的基于深度学习的材料显微图像缺陷识别方法，首先采用分类标记对获取的材料结构显微图像进行缺陷标注；然后利用仿射变换将样本图片集分割形成训练集；接着利用含有分类标注的训练集对预先构建的缺陷识别模型进行训练；最后利用训练好的缺陷识别模型对待识别缺陷样本进行缺陷检测，获得目标缺陷样本中的缺陷类型与个数。与现有技术相比，本发明采用分类标注的方法对缺陷图像进行标注，从而实现高精度的实例分割，提高缺陷检测结果的准确性，推动合金工业的智能化进展，加速第四次工业革命在金属铸造行业的应用。

2.本发明提供的基于深度学习的材料显微图像缺陷识别方法，采用的缺陷识别模型包括卷积网络模型、区域生成模型和语义分割模型三个子模型。在模型训练过程中，卷积网络模型提取训练集中子图片的特征集合以及预测得分，区域生成模型以训练集和卷积网络模型为输入，不断调整预测框位置以确定缺陷位置信息，最后经语义分割模型对像素进行检测判断缺陷类型，得到正确语义分割信息。相比传统堆砌卷积层的网络模型，本发明通过特征金字塔融合了底层到高层的特征图，在增加较少计算量的前提下融合低分辨率语义信息较强的特征图和高分辨率语义信息较弱但空间信息丰富的特征图。本发明法显著降低模型复杂度及运算时间，提高了模型计算速度和预测精度。

附图说明

图1为实例中的材料显微图像缺陷位置以及预测框图标注结果。

图2为本发明材料显微图像缺陷识别模型的网络结构示意图。

图3为本发明材料显微图像缺陷识别模型的识别过程示意图。

图4为本发明材料显微图像缺陷识别模型的训练方法整体流程图。

图5为本发明材料显微图像缺陷识别模型的训练方法循环迭代流程图。

图6为本发明基于深度学习的材料显微图像缺陷识别模型训练框架的组成结构框图。

图7为本发明基于深度学习的材料显微图像缺陷识别模型的推理流程框图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面结合具体实施例对本发明进行详细描述。

在此，还需要说明的是，为了避免因不必要的细节而模糊了本发明，在具体实施例中仅仅示出了与本发明的方案密切相关的结构和/或处理步骤，而省略了与本发明关系不大的其他细节。

另外，还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

本发明提供的材料显微图像缺陷识别方法，可以应用如下应用环境中，应用环境中可以包括终端和服务器，终端通过网络与服务器进行通信。该方法既可以应用在终端，也可以应用于服务器。其中，终端可以但不限于是各种工业计算机、个人计算机、笔记本电脑、智能手机、平板电脑。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

请参阅图1至7所示，本发明提供的图像缺陷识别方法，是一种基于多任务学习和基于深度学习的材料显微图像缺陷识别方法，包括：

获取待识别图像；

将所述待识别图像分割成若干预设大小的图像子块，输入到预先训练好的缺陷识别模型，得到待识别图像的缺陷信息。所述缺陷信息包括缺陷类别信息和缺陷位置信息。类别包括合金制品的常见微观缺陷检测，包括夹渣，浇不足，缩松，缩孔等，位置信息包括图像相对位置信息与相对面积。

其中，所述缺陷识别模型包括：

卷积神经网络模型，用于提取图像特征集合以及预测得分；

区域生成模型，用于确定缺陷位置信息；

和语义分割模型，用于确定缺陷类别信息。

请参阅图4和5所示，所述缺陷识别模型的训练方法包括如下步骤：

S1.获取若干显微图像，并对所述显微图像的缺陷类别和缺陷位置进行分类标注；将含有一或多个缺陷的显微图像通过仿射变换分割成按预设权重配比的训练集。

显微图像为通过高倍率显微镜采集的材料结构样本的各个视野下的图像。

所述分类标注的方法优选为包围框标注。请参阅图1所示，红色区域标出了显微图像缺陷类型以及相对图片位置以及相对面积大小。

接着经仿射变换丰富图像集，将图片分为若干预设大小的图像子块，成为训练集；仿射变换是通过将图片边界进行灰度填充后，再进行旋转，缩放，翻转，丰富图片集的操作。

具体地，所述分类标注和仿射变换包括：

1、获取若干显微图像；

2、利用labelme对显微图像进行缺陷位置与类别标注；

3、将标注的缺陷位置与类别信息输出到json文件中；

在实际操作过程中，打开labelme，导入显微图像，在显微图像中手动标记缺陷位置与缺陷类别，同时，可以利用仿射变换丰富图片集内容，软件会自动记录每个缺陷的位置范围，并将位置信息保存在json文件中。在缺陷位置标注时，通过软件可设置缺陷对应的类别，同样保存在json文件中。

如此操作，本发明采用分类标注的方法对缺陷图像进行标注，从而实现高精度的实例分割，提高缺陷检测结果的准确性，推动合金工业的智能化进展，加速第四次工业革命在金属铸造行业的应用。

特别地，在一些实施方式中，对于步骤S1，在获取若干显微图像后，需先剔除空白图像后再进行标注。

S2.利用所述训练集对预配置权重的缺陷识别模型进行训练。

其中，利用所述训练集对预先构建的缺陷识别模型进行训练，所述缺陷识别模型包括卷积神经网络模型、区域生成模型和语义分割模型。在所述训练过程中，所述卷积神经网络模型的输入为所述训练集，所述区域生成模型的输入为所述训练集以及所述卷积神经网络模型的输出，所述语义分割模型的输入为所述卷积神经网络和区域生成模型的输出。具体地，按显微图像缺陷信息分配训练集权重，将所述训练集输入构建的所述卷积神经网络模型；使用预配置权重的缺陷识别模型进行权重迁移；收集所述卷积神经网络模型最后一个卷积层输出的特征图，ROI Align层将多尺度特征图转化为相同尺寸，全连接层对特征图实现缺陷分类与回归，mask层实现语义分割。

通过采用上述技术方案，本发明缺陷识别模型包括卷积网络模型、区域生成模型和语义分割模型三个子模型，在模型训练过程中，卷积网络模型提取训练集中子图片的特征集合以及预测得分，区域生成模型以训练集和卷积网络模型为输入，不断调整预测框位置以确定缺陷位置信息，最后经语义分割模型对像素进行检测判断缺陷类型，得到正确语义分割信息。相比传统堆砌卷积层的网络模型，本发明的方法显著降低模型复杂度及运算时间，提高了模型计算速度和预测精度。

更具体地，请参阅图5所示，所述训练方法包括：

coco.h文件作为缺陷预设权重，利用随机高斯过程设置所述卷积神经网络模型的内参数；所述卷积神经网络模型接收上次训练返回的loss值对参数进行调整，将输入图像进行操作，提取出多组不同尺度的特征图；其中，coco.h文件为模型预设的一个预权重，是通过训练coco图像获得的一个已经完成的参数集，以此参数集为基础能够更快更准确的训练出模型。

其中，所述缺陷识别模型训练采用的损失函数为：

L＝L_cls+L_box+L_mask

其中，Lcls为分类损失，Lbox为框的回归损失，Lmask为掩码损失。

Lcls：利用softmax函数对候选区域进行分类，得到框的类别k。分类损失Lcls计算如下：

L_cls(P_i，P_i ^*)＝-log[P_i*P_i ^*+(1-P_i ^*)(1-P_i)]

其中，i为框的索引，Pi为目标的预测概率。当框内有物体时，P_i ^*为1，否则为0。

Lbox：实为先验框(Px,Py,Pw,Ph)与实际框(Gx,Gy,Gw,Gh)的回归，使用SmoothL1Loss计算回归框Lbox的损失。其公式如下：

其中，t_i为先验框(Px,Py,Pw,Ph)的坐标，为实际框(Gx,Gy,Gw,Gh)的坐标。x，y，w，h分别为框的中心坐标，长与宽。

Lmask：利用Lcls得到框的类别k，仅在k类别上计算误差。预测出二值掩膜后，对掩膜的每个像素点应用sigmoid函数，整体损失的计算使用平均二值交叉损失熵，公式如下：

式中，y为预测像素点，y_i为真实像素点。

在一些实施方式中，对于步骤S2，利用训练集对预先构建的缺陷识别模型中的卷积神经网络模型进行训练，包括：

1、将训练集输入预先构建的卷积神经网络模型，设置模型预设系数；

2、卷积神经网络模型中每一卷积层提取出不同尺度的语义较强的特征图，特征金字塔融合四个卷积层的特征图；

3、利用随机高斯分布初始化卷积神经网络模型的所有权值，并利用训练集对卷积神经网络模型进行训练，获取卷积神经网络模型中最后一个卷积层输出的特征图。

请参阅图2所示，本发明卷积神经网络模型分为了5个层，每一层不同尺度的特征图都具有较强的语义信息。特征金字塔融合了底层到高层的特征图，在增加较少计算量的前提下融合低分辨率语义信息较强的特征图和高分辨率语义信息较弱但空间信息丰富的特征图。

全连接模块bbox和score实质上是一个回归子网络，bbox和score均包括2个卷积层，bbox和score中的第一个卷积层均用于对输入的特征图采用n n滑动窗口在该特征图上滑动扫描，将该特征图中的每个像素(每个滑窗位置)编码成一个低维的特征向量，输出的低维特征向量输入第二个卷积层；bbox和score中的第二个卷积层分别回归输出每个滑窗位置的多个参考包围框以及每个参考包围框的预测得分(预测得分表示参考包围框属于对应缺陷的概率)。

特别地，在一些实施方式中，所述卷积神经网络模型如图2中Resnet残差网络所示，依次包括5个阶段101个卷积层、2个并行的全连接模块(bbox和score)以及1个输出层。上述每个卷积层后均接有一个batchnorm层进行归一化，卷积层均用于对输入的特征图进行特征提取。其中一个全连接模块(bbox)中的第二卷积层用于对第一卷积层的输出进行回归并输出每个滑窗位置内多个参考包围框，另一个全连接模块(score)中的第二卷积层用于对第一卷积层的输出进行回归并输出每个参考包围框对应的预测得分(预测得分表示参考包围框属于对应缺陷的概率)。

本实施例中，利用均值为0和标准差为0.1的插值方式初始化卷积神经网络的所有权值，所有偏置最初设置为0.1，利用随机梯度下降法(SGM)对卷积神经网络权值进行学习，设定初始学习率为10^-4。

在一些实施方式中，所述区域生成模型如图2中的RPN网络所示，包括5个卷积层、2个并行的全连接模块以及1个输出层，输出层后接1个RoI Align模块。

其中，前3个卷积层后面均连接1个共享最大池化层；每个子网络依次包括3个卷积层以及一个softmax层或者1个regression层。

利用训练集以及卷积神经网络模型的输出对预先构建的缺陷识别模型中的区域生成模型进行训练，包括：

1、由上述卷积神经网络模型输出后的结果得到缺陷的初步位置。

2、使用平移和缩放对应的线性回归方法对识别位置进行具体调整，将新得到的位置信息返回，判断是否超出原初步位置范畴。

3、设置重叠率阈值，计算所述卷积神经网络模型输出的预测细胞包围框与实际缺陷包围框的重叠率，将大于所述重叠率阈值的所述重叠率对应的预测缺陷包围框作为样本框；

所述重叠率阈值是指预测缺陷包围框与实际缺陷包围框的重叠率阈值。本实施例中，重叠率阈值为0.5。

特别地，对于每个样本框，首先进行二值分割掩码标注，具体为：使用插值方式将样本框裁剪为固定大小(例如，细胞包围框的大小为15*50，而二值分割掩码的固定大小为25*25，因此需要将15*50进行裁剪插值变成25*25大小)。然后将每个样本框内细胞边界外的区域作为背景。

4、返回重新平移或缩放，否则以新位置信息作为初步位置循环。

在另一些实施方式中，所述语义分割模型如图2和图3右下所示，依次包括1个feature map层，3个并行的全连接模块以及1个输出层。

利用所述区域生成模型的输出对预先构建的缺陷识别模型中的语义分割模型进行训练，包括：

通过RoI Align层对输入不同尺寸的特征图进行归一化调整；

采用梯度优化算法，利用分割掩码生成网络模型输出的二值分割掩码图对预先构建的语义分割模型进行训练，语义分割模型采用的损失函数为：

优选地，为解决缺陷图像样本不均衡问题，引入交叉熵权重解决样本不均衡的问题：

其中w_c为每个类别的权重，其计算公式为：

式中，N表示总的像素个数，而N_c表示类别为c的像素个数。相比于原始的交叉熵Loss，在样本数量不均衡的情况下可以获得更好的效果。

请参阅图6所示，基于上述图像缺陷识别方法，本发明还提供一种基于深度学习的材料显微图像缺陷识别模型训练装置，包括：

请参阅图7所示，基于上述图像缺陷识别方法，本发明还提供基于深度学习的材料显微图像缺陷识别装置，包括：

数据输入模块，用于获取待识别图像；

基于上述图像缺陷识别方法，本发明还提供一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述所述方法的步骤。

以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围。

Claims

1.一种基于深度学习的材料显微图像缺陷识别方法，其特征在于，包括：

获取待识别图像；

其中，所述缺陷识别模型包括：

卷积神经网络模型，用于提取图像特征集合以及预测得分；

区域生成模型，用于确定缺陷位置信息；

和语义分割模型，用于确定缺陷类别信息。

2.根据权利要求1所述的基于深度学习的材料显微图像缺陷识别方法，其特征在于，所述缺陷识别模型的训练方法包括如下步骤：

S2.利用所述训练集对预配置权重的缺陷识别模型进行训练。

3.根据权利要求2所述的基于深度学习的图像缺陷识别方法，其特征在于，所述训练方法包括：

使用预配置权重的缺陷识别模型进行权重迁移；

4.根据权利要求3所述的基于深度学习的图像缺陷识别方法，其特征在于，所述缺陷识别模型训练采用的损失函数为：

L＝L_cls+L_box+L_mask

5.根据权利要求3所述的基于深度学习的图像缺陷识别方法，其特征在于，所述语义分割模型的损失函数为：

其中，M表示类别数量；y_c是指示变量，如果该类别和样本的类别相同就是1，否则是0；pc代表观测样本属于c类别的预测概率。

6.根据权利要求4所述的基于深度学习的图像缺陷识别方法，其特征在于，所述训练方法包括：

7.根据权利要求2所述的基于深度学习的图像缺陷识别方法，其特征在于，在步骤S1中，所述分类标注的方法为包围框标注；所述仿射变换是将图像边界进行灰度填充后，再进行旋转、缩放、翻转，以丰富图像集。

8.一种基于深度学习的材料显微图像缺陷识别模型训练装置，其特征在于，包括：

9.一种基于深度学习的材料显微图像缺陷识别装置，其特征在于，包括：

数据输入模块，用于获取待识别图像；

10.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时，执行权利要求1至7中任一项所述的基于深度学习的材料显微图像缺陷识别方法。