CN114119627B

CN114119627B - 基于深度学习的高温合金微观组织图像分割方法及装置

Info

Publication number: CN114119627B
Application number: CN202111216114.6A
Authority: CN
Inventors: 张利欣; 尧昊天; 徐正光; 边胜琴
Original assignee: University of Science and Technology Beijing USTB
Current assignee: University of Science and Technology Beijing USTB
Priority date: 2021-10-19
Filing date: 2021-10-19
Publication date: 2022-05-17
Anticipated expiration: 2041-10-19
Also published as: CN114119627A

Abstract

本发明公开了一种基于深度学习的高温合金微观组织图像分割方法及装置，该方法包括：获取待分割图像，并对所述待分割图像进行图像特征提取；基于改进的SNL模块，对提取到的图像特征进行注意力机制提取融合，得到所述待分割图像对应的特征图；基于得到的特征图，实现高温合金微观组织结构图像分割。与传统图像处理方法对比，本发明的分割精度大幅度提升，甚至受到噪声污染的图像也能获取良好的分割效果，与UNet网络结构相比，本发明解决了感受野过于局部，注意机制过于单一的问题的同时，分割效果也明显提升。

Description

基于深度学习的高温合金微观组织图像分割方法及装置

技术领域

本发明涉及图像处理与计算机视觉技术领域，特别涉及一种基于深度学习的高温合金微观组织图像分割方法及装置。

背景技术

高温合金因具有良好的抗热腐蚀、断裂韧性、抗氧化、抗疲劳性能和较高的高温强度等综合性能，在航空航天、军事设备以及船舶建造等领域有着庞大的需求。作为航空等国家重点项目领域所需求的关键材料，其性能评价对国家相关领域装备设施研发、量产以及后续应用产生重要影响。

高温合金材料的性能主要取决于材料的微观组织结构，因此高温合金微观组织结构特征分析成为研究材料合成工艺，成分，结构以及性能的重要环节。获取高温合金材料围观组织结构特征的主要途径一般是利用图像处理技术对高温合金材料电镜显微组织图像进行处理和分析。高温合金材料微观组织的结构分析主要针对微观组织中不同金相的形状、大小尺寸、分布情况等特征展开。

在传统的微观组织结构分析过程中，主要使用人力，依靠人眼分辨并根据相关国际或国家标准进行结构微观组织结构特征相应指标的计算及评定工作。人工方法存在着主观因素影响较大，耗费时间成本过大，局部统计受限以及精度不高等问题。因此，寻求更为先进的高温合金微观组织图像分析方法，提高微观组织结构特征的计算速度和精度成为材料金相分析的研究热点。

发明内容

本发明提供了一种基于深度学习的高温合金微观组织图像分割方法及装置，以解决人工方法存在的主观因素影响较大，耗费时间成本过大，局部统计受限以及精度不高的技术问题。

为解决上述技术问题，本发明提供了如下技术方案：

一方面，本发明提供了一种基于深度学习的高温合金微观组织图像分割方法，该基于深度学习的高温合金微观组织图像分割方法包括：

获取待分割图像，并对所述待分割图像进行图像特征提取；

基于改进的SNL模块，对提取到的图像特征进行注意力机制提取融合，得到所述待分割图像对应的特征图；

基于得到的特征图，实现高温合金微观组织结构图像分割。

进一步地，对所述待分割图像进行图像特征提取，包括：

以UNet作为骨干网络主体，利用编码器部分对待分割图像进行卷积，得到所述待分割图像的特征数据；

利用所述特征数据进行多级池化，提取多尺度特征，得到多尺度图像特征。

进一步地，所述编码器部分包括四次重复的卷积下采样结合的结构模块，每个结构模块均包括卷积层、ReLU激活函数、BN层和最大池化下采样；其中，

卷积层提取特征并增加改变通道数；

ReLU激活函数增加网络的非线性，提高网络的辨别能力以及解决训练过程中的梯度消失与梯度爆炸的问题；

BN层加快网络训练和收敛的速度，控制梯度爆炸，防止梯度消失和过拟合；

最大池化下采样保证特征的位置与旋转不变性的同时，减少模型参数数量，减少过拟合问题。

进一步地，所述结构模块中的卷积层为3×3卷积。

进一步地，所述基于改进的SNL模块，对提取到的图像特征进行注意力机制提取融合，得到所述待分割图像对应的特征图，包括：

对于输入的形状为[C,W,H]的图像特征，分别经过两个分支上的1×1卷积操作后，重构成形状为[WH,C]的特征块

和形状互为转置[C,WH]的特征块

将两个特征块进行矩阵相乘，对称归一化后得到关联矩阵A，公式如下：

式中，M＝TP，

是一个包含

的每个顶点的度的对角线矩阵；

对于输入的形状为[C,W,H]的图像特征，经过另一个分支上的1×1卷积操作后，重构成形状为[WH,C]的特征块

和形状互为转置[C,WH]的特征块

特征块

和特征块

分别与关联矩阵A进行矩阵左乘和矩阵右乘运算后，分别通过卷积形式的参数矩阵W₁和W₂运算后特征元素相加，再通过BN层，公式如下：

通过下式得到输出的特征图Y：

其中，输入的图像特征X经过整个改进的SNL模块后输出为特征图Y，这样的模块称为一个阶段，根据处理的数据集以及任务要求，选择性地重复n次以达到最佳特征注意力提取效果，其中，n为预设的大于1的整数值。

进一步地，基于得到的特征图实现高温合金微观组织结构图像分割，包括：

利用解码部分将通过改进的SNL模块得到的特征图进行上采样，再与编码器中相应各层的特征图通道拼接融合，重复融合过程后，输出图像像素分类通道特征图，以实现高温合金微观组织结构图像分割。

进一步地，所述利用解码部分将通过改进的SNL模块得到的特征图进行上采样，再与编码器中相应各层的特征图通道拼接融合，重复融合过程后，输出图像像素分类通道特征图，以实现高温合金微观组织结构图像分割，包括：

将通过改进的SNL模块得到的特征图在解码部分经过线性插值的方式进行上采样，再与编码器相应层的特征进行通道上的特征拼接，之后再进行卷积，重复融合过程使得特征图尺寸大小与原图一致，之后再利用卷积操作进行图像像素级的分类，输出与像素分类类别数相等的特征图通道。

另一方面，本发明还提供了一种基于深度学习的高温合金微观组织图像分割装置，该基于深度学习的高温合金微观组织图像分割装置包括：

特征提取模块，用于获取待分割图像并对待分割图像进行图像特征提取；

注意力机制提取融合模块，用于基于改进的SNL模块，对所述特征提取模块提取到的图像特征进行注意力机制提取融合，得到待分割图像对应的特征图；

高温合金微观组织图像分割模块，用于基于所述注意力机制提取融合模块得到的特征图，实现高温合金微观组织结构图像分割。

再一方面，本发明还提供了一种电子设备，其包括处理器和存储器；其中，存储器中存储有至少一条指令，所述指令由处理器加载并执行以实现上述方法。

又一方面，本发明还提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令，所述指令由处理器加载并执行以实现上述方法。

本发明提供的技术方案带来的有益效果至少包括：

本发明提供的分割网络结合了UNet与改进SNL模块优势，在保持训练精度和推理速度的同时，获得了更大的感受野；而且本发明的方案通过UNet的特征拼接融合，加强了深浅各层特征图之间的信息交互，提高了模型的分割性能；本发明提出的基于深度学习的高温合金微观组织图像分割方法在分割精度上表现优异，在NVIDIA Tesla V100-SXM2上实现了97.13％准确率(Accuracy，Acc)和94.23％均交并比(Mean Intersection over Union，mIoU)。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的基于深度学习的高温合金微观组织图像分割方法的执行流程示意图；

图2是本发明实施例提供的基于深度学习的高温合金微观组织图像分割方法所采用的整体网络模型SSNL-Unet的网络结构示意图；

图3是本发明实施例提供的基于深度学习的高温合金微观组织图像分割方法所采用的SSNL模块网络结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

第一实施例

针对传统的人工方法所存在的主观因素影响较大，耗费时间成本过大，局部统计受限以及精度不高等技术问题，本实施例提供了一种基于深度学习的高温合金微观组织图像分割方法，本方法提出了一种基于结合UNet及改进的非局部(Nonlocal)网络模块优势的如图2所示的SSNL-UNet分割网络模型，以准确分割高温合金微观组织结构金相图，解决现有方法分割效果不佳的问题，以及满足加快对材料微观组织结构的分析速度和增加精度的要求。

其中，UNet网络的典型特点是，它是U型对称结构，左侧是卷积层，右侧是上采样层，包含4个卷积层和对应的4个上采样层。UNet网络的每个卷积层得到的特征图都会特征拼接到对应的上采样层，从而实现对每层特征图都有效使用到后续计算中。这样，同其他的一些网络结构比如FCN比较，UNet避免了直接在高级特征图中进行监督和损失计算，而是结合了低级特征图中的特征，从而可以使得最终所得到的特征图中既包含了高层特征，也包含很多的低层特征，实现了不同尺度下的特征融合，提高模型的结果精确度。

非局部(Nonlocal)网络模块中Local这个词主要是针对卷积网络的感受野(receptive field)过于局部而言，该模块可以更稳健和灵活地捕获远程依赖关系，以帮助深度网络更好地融合非局部的信息。目前提出的一些Nonlocal网络模块有NL，A²，NS，CC，CGNL等。A²提出双注意(A²)块，首先收集整个空间中的特征，然后将它们分配回每个位置。CGNL提出了紧凑的广义非局部(CGNL)块来捕获跨通道线索，这也不可避免地增加了注意图的噪声。CC提出了一种轻量级非局部块，称为交错注意块(CC)，它将NL的位置注意分解为确定的列和行注意。为了提高NL块的稳定性，NS提出了利用关联矩阵的拉普拉斯量作为注意映射，该非局部阶段(NS)模块可以遵循扩散特性。

基于上述，本实施例方法的执行流程如图1所示，包括以下步骤：

S1，获取待分割图像，并对待分割图像进行图像特征提取；

具体地，本实施例所采用的整体网络模型SSNL-Unet的网络结构如图2所示，在此基础上，上述S1的实现过程如下：

S11，骨干网络主体采用UNet，编码器部分对输入图像进行卷积，输出特征图；

S12，生成多尺度特征，利用S11中骨干网络提取的特征图，进行多级池化，提取多尺度特征，得到多尺度图像特征。

进一步地，需要说明的是，通过图像输入的编码器部分进行图像特征提取，通过多次最大池化下采样减少网络参数量并获得较大的图像感受野。编码器部分具体包括了四次重复的卷积下采样结合的结构，每个结构模块包括了卷积、ReLU激活函数、BN层、最大池化下采样。其中，3×3卷积提取特征并增加改变通道数、ReLu激活函数增加网络的非线性，提高网络的辨别能力以及解决训练过程中的梯度消失与梯度爆炸的问题、BN层加快网络的训练和收敛的速度，控制梯度爆炸防止梯度消失以及防止过拟合、最大池化下采样保证特征的位置与旋转不变性的同时减少模型参数数量，减少过拟合问题。

S2，基于改进的SNL模块SSNL(Symmetrical Spectral Nonlocal Blocks)，对提取到的图像特征进行注意力机制提取融合，得到待分割图像对应的特征图；

需要说明的是，通过编码器结构获取的图像特征送入本发明最重要的如图3所示的改进结构SSNL(Symmetrical Spectral Nonlocal Blocks)模块中。本模块本质上是一种非局部的注意力机制模块，针对卷积网络的感受野过于局部而言，该模块可更稳健和灵活地捕获远程依赖关系，以帮助深度网络更好地融合非局部的信息。具体地，在本实施例中，上述S2的实现过程如下：

输入的形状为[C,W,H]的图像特征分别经过两个分支上的1×1卷积操作后，重构成形状为[WH,C]的特征块

和形状互为转置[C,WH]的特征块

上式中，M＝TP，

是一个包含

的每个顶点的度的对角线矩阵；对称处理后的

由图像像素之间的两两相似性组成，对

归一化处理后的关联矩阵A在图2中由形状为[WH,WH]的特征块att表示。关联矩阵A本身为图像特征的注意力模块，包含了图像像素之间的两两相似性关系和非局部的注意力信息。

输入的形状为[C,W,H]的图像特征经过另一个分支上的1×1卷积操作后，重构成形状为[WH,C]的特征块

和形状互为转置[C,WH]的特征块

特征块

和特征块

输出特征块在此基础上与输入的特征块Identity直接元素相加，形成残差条约连接。公式如下：

输入的图像特征X经过整个模块后输出为特征图Y，这样的模块称为一个阶段，根据处理的数据集以及任务要求可以选择性地重复n次以达到最佳特征注意力提取效果。由于特征块

和特征块

分别于关联矩阵A进行矩阵左乘运算和矩阵右乘运算的左右两路的特点，在谱非局部模块(Spectral Nonlocal Blocks，SNL)的基础上，本实施例将其命名为对称谱非局部模块(Symmetrical Spectral Nonlocal Blocks，SSNL)模块。

S3，基于得到的特征图，实现高温合金微观组织结构图像分割；

具体地，在本实施例中，上述S3的实现过程如下：

利用解码部分将通过S2得到的特征图进行上采样，再与编码器中相应各层的特征图通道拼接融合，重复融合过程后，输出图像像素分类通道特征图，以实现高温合金微观组织结构图像分割。

进一步地，本实施例将通过SSNL模块输出的图像特征块在解码部分经过线性插值的方法进行上采样，再与编码器相应层的特征进行通道上的特征拼接，之后再进行传统的卷积模块，重复多次上述步骤以后，特征形状大小达到与原图一样之后再利用卷积进行图像像素级的分类，输出与像素分类类别数相等的特征图通道，以便后续进行损失函数的计算和网络参数的训练。以达到对高温合金微观组织图像进行分割任务的目的。

综上，本实施例提出了一种基于结合UNet及改进的Nonlocal网络模块优势的SSNL-UNet分割网络模型，与传统图像处理方法对比，本实施例所提供的分割方法的分割精度大幅度提升，甚至受到噪声污染的图像也能获取良好的分割效果，与Unet网络结构相比，本实施例所提供的分割方法解决了感受野过于局部，注意机制过于单一的问题的同时，分割效果也明显提升。本实施例所提供的分割方法在NVIDIA Tesla V100-SXM2上实现了97.13％Acc和94.23％mIoU。

第二实施例

本实施例提供了一种基于深度学习的高温合金微观组织图像分割装置，该基于深度学习的高温合金微观组织图像分割装置包括以下模块：

本实施例的基于深度学习的高温合金微观组织图像分割装置与上述第一实施例的基于深度学习的高温合金微观组织图像分割方法相对应；其中，本实施例的基于深度学习的高温合金微观组织图像分割装置中的各功能模块所实现的功能与上述第一实施例的基于深度学习的高温合金微观组织图像分割方法中的各流程步骤一一对应；故，在此不再赘述。

第三实施例

本实施例提供一种电子设备，其包括处理器和存储器；其中，存储器中存储有至少一条指令，所述指令由处理器加载并执行，以实现第一实施例的方法。

该电子设备可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(central processing units，CPU)和一个或一个以上的存储器，其中，存储器中存储有至少一条指令，所述指令由处理器加载并执行上述方法。

第四实施例

本实施例提供一种计算机可读存储介质，该存储介质中存储有至少一条指令，所述指令由处理器加载并执行，以实现上述第一实施例的方法。其中，该计算机可读存储介质可以是ROM、随机存取存储器、CD-ROM、磁带、软盘和光数据存储设备等。其内存储的指令可由终端中的处理器加载并执行上述方法。

此外，需要说明的是，本发明可提供为方法、装置或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

最后需要说明的是，以上所述是本发明优选实施方式，应当指出，尽管已描述了本发明优选实施例，但对于本技术领域的技术人员来说，一旦得知了本发明的基本创造性概念，在不脱离本发明所述原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。