CN114511576A

CN114511576A - 尺度自适应特征增强深度神经网络的图像分割方法与系统

Info

Publication number: CN114511576A
Application number: CN202210407298.2A
Authority: CN
Inventors: 袭肖明; 宋祚永; 张光; 聂秀山; 孙良运
Original assignee: Shandong Jianzhu University
Current assignee: Shandong Jianzhu University
Priority date: 2022-04-19
Filing date: 2022-04-19
Publication date: 2022-05-17
Anticipated expiration: 2042-04-19
Also published as: CN114511576B

Abstract

本发明属于基于特定计算模型的计算机系统领域，提供了一种尺度自适应特征增强深度神经网络的图像分割方法与系统。该方法包括，基于输入图像数据采用尺度自适应特征增强深度神经网络，得到预测结果；将输入图像数据进行预处理，得到分割掩码图；基于输入图像数据，提取不同尺度的底层特征；基于不同尺度的底层特征，采用注意力网络，生成权重注意力图；将不同尺度的底层特征和权重注意力图相乘，得到第一特征图；提取第一特征图的关键特征信息，得到图像的高层语义特征图；提取分割掩码图的特征，得到目标感知注意力图；根据高层语义特征图和目标感知注意力图，得到第二特征图；将第一特征图和第二特征图进行融合，得到用于预测的图像全局特征图。

Description

尺度自适应特征增强深度神经网络的图像分割方法与系统

技术领域

本发明属于基于特定计算模型的计算机系统领域，尤其涉及一种尺度自适应特征增强深度神经网络的图像分割方法与系统。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。

图像分割是数字图像处理至关重要的环节，在目标提取、智能安防、病灶分割等众多领域应用广泛。然而现有的图像分割方法大多是针对于具有一定尺寸大中型目标，对于图像中可视化特征极少的小目标，在性能上难以达到令人满意的效果。例如，在医学图像分割中，由于病症较轻的患者，病灶区域表示信息较小，分割难度较大。因此，关注小目标区域可以克服现有分割方法提取目标尺寸单一的局限性，有助于进一步提升图像分割性能。

深度学习由于其强大的特征学习能力，已成为当今主流的分割方法。然而，由于其层次化的特征学习方式，导致其在学习高层特征时，丢失小目标的信息。同时，由于小目标像素数量较少，使得网络在训练过程中学习大量非小目标区域的知识，忽略了小目标的特性，进而限制了分割性能的提升。

发明内容

为了解决上述背景技术中存在的技术问题，本发明提供一种尺度自适应特征增强深度神经网络的图像分割方法与系统，其可用于小目标图像分割任务，进一步提升图像分割精度。

为了实现上述目的，本发明采用如下技术方案：

本发明的第一个方面提供一种尺度自适应特征增强深度神经网络的图像分割方法。

尺度自适应特征增强深度神经网络的图像分割方法，包括：

基于输入图像数据，采用尺度自适应特征增强深度神经网络，得到预测结果；

所述输入图像数据，采用尺度自适应特征增强深度神经网络，得到预测结果的过程包括：

将输入图像数据进行预处理，得到分割掩码图；

基于输入图像数据，提取不同尺度的底层特征；基于不同尺度的底层特征，采用注意力网络，生成权重注意力图；将不同尺度的底层特征和权重注意力图相乘，得到第一特征图；

提取第一特征图的关键特征信息，得到图像的高层语义特征图；提取分割掩码图的特征，得到目标感知注意力图；根据高层语义特征图和目标感知注意力图，得到第二特征图；

将第一特征图和第二特征图进行融合，得到用于预测的图像全局特征图。

本发明的第二个方面提供一种尺度自适应特征增强深度神经网络的图像分割系统。

尺度自适应特征增强深度神经网络的图像分割系统，包括：

预测模块，其被配置为：基于输入图像数据采用尺度自适应特征增强深度神经网络，得到预测结果；

模型构建模块，其被配置为：所述尺度自适应特征增强深度神经网络包括图像预处理模块、底层特征提取模块、高层特征提取模块和融合模块；

图像预处理模块，其被配置为：将输入图像数据进行预处理，得到分割掩码图；

底层特征提取模块，其被配置为：基于输入图像数据，提取不同尺度的底层特征；基于不同尺度的底层特征，采用注意力网络，生成权重注意力图；将不同尺度的底层特征和权重注意力图相乘，得到第一特征图；

高层特征提取模块，其被配置为：提取第一特征图的关键特征信息，得到图像的高层语义特征图；提取分割掩码图的特征，得到目标感知注意力图；根据高层语义特征图和目标感知注意力图，得到第二特征图；

融合模块，其被配置为：将第一特征图和第二特征图进行融合，得到用于预测的图像全局特征图。

不同于大多数特征提取网络对于底层特征学习和高层特征学习使用相同的特征学习模块，本发明在传统的基网络基础上，提出了一种新的尺度自适应的特征增强网络，使用不同的模块对底层特征和高层特征进行更有效的学习。该网络将特征提取分成低级特征学习和高级特征学习两部分。在低级学习特征中，引入多尺度学习技术，使其可以获取不同大小目标的底层细节信息。在高级特征学习中，引入小目标感知注意力模块，该模块主要用于约束高级特征中要将注意力聚焦于小目标部分，进而防止小目标语义信息的丢失。引入特征级注意力融合模块，用于融合提取到的低级特征和高级特征。引入重要性损失函数，在传统的像素级损失函数中加入重要性权重

，同时引入重要性权重

的稀疏正则化，使得模型在训练过程中关注到数量较少的小目标。

与现有技术相比，本发明的有益效果是：

本发明提出的一种尺度自适应特征增强深度神经网络的图像分割方法与系统，与传统方法相比，该方法在图像分割方面表现出了优异性。一方面，不同于大多数特征提取网络对于底层特征学习和高层特征学习使用相同的特征学习模块，本发明创造性的提出了一种新的尺度自适应的特征增强网络，该网络利用不同的特征学习模块自适应地学习多尺度的底层细节信息，同时，可对高层语义信息进行增强，提升了对于不同大小目标的特征学习能力。另一方面，本发明构建了一种自适应的分类损失函数，可自适应的选择对于像素分类较为重要的像素，使得这些像素在训练阶段能够获得模型重点关注，有助于提升模型对不同大小目标的分割精度。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1是本发明实施例二示出的尺度自适应特征增强深度神经网络的图像分割系统的框架图；

图2是本发明实施例二示出的尺度自适应特征增强深度神经网络的图像分割系统的框架图。

具体实施方式

下面结合附图与实施例对本发明作进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

需要注意的是，附图中的流程图和框图示出了根据本公开的各种实施例的方法和系统的可能实现的体系架构、功能和操作。应当注意，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，所述模块、程序段、或代码的一部分可以包括一个或多个用于实现各个实施例中所规定的逻辑功能的可执行指令。也应当注意，在有些作为备选的实现中，方框中所标注的功能也可以按照不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，或者它们有时也可以按照相反的顺序执行，这取决于所涉及的功能。同样应当注意的是，流程图和/或框图中的每个方框、以及流程图和/或框图中的方框的组合，可以使用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以使用专用硬件与计算机指令的组合来实现。

实施例一

本实施例提供了一种尺度自适应特征增强深度神经网络的图像分割方法，本实施例以该方法应用于服务器进行举例说明，可以理解的是，该方法也可以应用于终端，还可以应用于包括终端和服务器和系统，并通过终端和服务器的交互实现。服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务器、云通信、中间件服务、域名服务、安全服务CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。本实施例中，该方法包括：

将输入图像数据进行预处理，得到分割掩码图；

本实施例中的一种尺度自适应特征增强深度神经网络实现图像分割的网络模型训练过程，包括如下步骤：

S1：数据集预处理

由于小目标图像样本的像素数量较少，不利于深度神经网络的训练，因此需要对原始数据集中的小目标物体进行数据增强。首先依据分割掩码将数据集图像中的小目标区域复制并随机粘贴到原图像中。在粘贴至新位置前，对图像执行随机变换操作，具体方式包括随机缩放至原尺寸的±30%、随机旋转±20°、增加噪声等。需要特别注意的是，原始目标区域与粘贴的副本间不能互相遮挡。

S2：尺度自适应卷积模块

图像首先被馈送到3个卷积层以提取高分辨率的底层特征

。在这里，根据目标尺寸的不同，将图像分别输入

等多个并行的大小不一的卷积核中，学习不同尺度的底层特征，如纹理、边缘等细节信息。

S3：尺度注意力模块

针对提取到的不同尺度的特征，构建了一个小型的注意力网络,该网络由两个卷积层组成。第一个卷积层使用

的卷积核和ReLU激活函数。第二个卷积层使用

个滤波器，然后再通过softmax逐元素的归一化，生成权重注意力图

。最后将提取到的不同尺度特征

与权重注意力图

相乘，使得提取到的底层特征粒度适应不同目标区域的大小。

S4：高层语义特征提取模块

将学习获得的底层特征

馈送到2个卷积层中，用于提取图像的关键特征信息，得到图像的高层语义特征图

。然后利用拉普拉斯滤波器（Laplacian filter）对学到的高层特征图进行锐化，使得小目标区域的语义特征信息相较于其他区域有明显差别，为计算一致性损失做准备。

S5：小目标感知注意力模块

将分割掩码图馈送到小目标感知注意力模块，该模块首先使用一个卷积层提取特征，然后分别利用两个卷积层获取归一化层的缩放系数与偏置项。将提取到的特征缩放并偏置后输出，将目标的重要信息编码到学到的特征中，得到小目标感知注意力图

，实现对图像分割掩码的重新编码。

S6：计算特征一致性损失

为了使学到的高层特征

的注意力区域与小目标感知注意力图

保持一致，引入一致性正则化，计算特征一致性损失

，特征的注意力区域和小目标感知注意力图越相近，两者的一致性损失就越小。

S7：特征级注意力融合模块

该模块利用注意力机制融合获得的低级特征和高级特征。具体来说，将通过attention操作产生的权重因子

与对应的不同层级特征相乘，然后相加，得到最终融合后的图像全局特征图

。

S8：构建自适应的损失函数

针对图像中的不同像素，在传统的交叉熵损失函数的基础上引入自适应分类权重

，构建自适应损失函数。相较于为所有像素分配相等的权重的方式，自适应分类权重

给予重要像素较大的权重，以突出其重要性。同时引入该权重的稀疏正则化项

，保证权重的稀疏性，进而使得模型在训练时关注到数量较少的重要的像素。这些像素包括小目标像素和容易分错的模糊边缘的少量像素。在该损失函数中，分类重要性权重是通过自动学习的形式得出的。

S9：计算自适应的交叉熵损失

针对经过分割模型获得的全局特征图

，计算各像素的概率最大值所对应的类别，记作

。将像素的预测类别

与真实标签类别

进行自适应的交叉熵损失计算：

。

S10：计算网络模型损失

在这里，将网络模型损失

定义为自适应的交叉熵损失

和特征一致性损失

的组合。特征一致性损失与自适应的交叉熵损失以多次实验得出的一个参数

作为特征一致性损失的系数，然后将其结果与自适应的交叉熵损失相加计算得到网络模型的总损失：

。

S11：网络训练

在网络模型中使用特征一致性损失与自适应的交叉熵损失加权和

做为总损失，重复进行反向传播训练。此过程，损失值会伴随训练轮次的增多而慢慢下降，直至预先设定的训练轮次或者损失值呈现平稳趋势。保存网络模型作为训练结果。

S12：预测阶段

输入待测试的图像数据进入已训练好的网络模型中进行预测，获得图像分割结果图。

实施例二

本实施例提供了一种尺度自适应特征增强深度神经网络的图像分割系统。

如图1所示，尺度自适应特征增强深度神经网络的图像分割系统，包括：

如图2所示，对整个图像分割系统模型框架做解释说明。图2中所对应的虚线框内系统为主要执行分割功能的系统模块，其中向量提取模块利用S2与S4中所述模块分别提取底层特征

和高层特征

，然后将二者通过S7中所述特征级注意力融合模块融合，得到全局特征图

。然后进入损失函数计算损失，根据损失函数来反向传播调节网络参数，使网络达到最佳的状态。获取分割结果利用S9中所述网络进行训练，最后输出预测结果。

用户输入待测试图像数据进入分割系统，分割系统内部自动进行特征提取、计算损失函数和计算分割结果三个过程，最后输出分割结果与用户进行交互。

此处需要说明的是，上述预测模块、模型构建模块、图像预处理模块、底层特征提取模块、高层特征提取模块和融合模块与实施例一中的步骤所实现的示例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.尺度自适应特征增强深度神经网络的图像分割方法，其特征在于，包括：

所述输入图像数据，采用尺度自适应特征增强深度神经网络的过程包括：

将输入图像数据进行预处理，得到分割掩码图；

2.根据权利要求1所述的尺度自适应特征增强深度神经网络的图像分割方法，其特征在于，所述输入图像数据为待测试的图像数据或者训练的图像数据。

3.根据权利要求1所述的尺度自适应特征增强深度神经网络的图像分割方法，其特征在于，所述图像预处理模块具体过程包括：

获取图像样本数据集；

依据分割掩码将图像数据集中的目标区域复制，然后随机粘贴到原图像中，得到分割掩码图和初始图像;

其中，目标区域与粘贴的副本间不能互相遮挡。

4.根据权利要求3所述的尺度自适应特征增强深度神经网络的图像分割方法，其特征在于，在粘贴至新位置前，对图像执行随机变换操作，所述随机变换操作包括随机缩放尺寸、随机旋转或增加噪声中的至少一种。

5.根据权利要求3所述的尺度自适应特征增强深度神经网络的图像分割方法，其特征在于，在得到所述初始图像之后包括：

采用不同尺寸的卷积层提取初始图像在不同尺度的底层特征；

基于不同尺度的底层特征，采用注意力网络，生成权重注意力图；

将不同尺度的底层特征与生成权重注意力图相乘，使得提取到的底层特征粒度适应不同目标区域的大小，得到第一特征图。

6.根据权利要求1所述的尺度自适应特征增强深度神经网络的图像分割方法，其特征在于，得到第二特征图的过程包括：基于第一特征图，提取图像的关键特征信息，得到图像的高层语义特征图；提取分割掩码图的特征，利用两个卷积层获取归一化层的缩放系数与偏置项，将提取到的特征缩放并偏置后输出，得到目标感知注意力图；对高层语义特征图和目标感知注意力图进行一致性正则化处理，得到第二特征图。

7.根据权利要求1所述的尺度自适应特征增强深度神经网络的图像分割方法，其特征在于，所述尺度自适应特征增强深度神经网络通过训练得到，所述训练的过程采用网络模型损失函数，对所述尺度自适应特征增强深度神经网络进行优化；所述网络模型损失函数包括自适应的交叉熵损失函数和特征一致性损失函数。

8.根据权利要求7所述的尺度自适应特征增强深度神经网络的图像分割方法，其特征在于，所述自适应的交叉熵损失函数为，在交叉熵损失函数的基础上引入自适应分类权重

和自适应分类权重

的稀疏正则化项

，构建自适应的交叉熵损失函数；其中，所述自适应分类权重

提高重要像素的权重，以突出其重要性；所述稀疏正则化项

，保证了自适应分类权重

的稀疏性。

9.根据权利要求1所述的尺度自适应特征增强深度神经网络的图像分割方法，其特征在于，在得到所述图像全局特征图之后包括：

计算图像全局特征图每个像素的概率，得到概率最大值所对应的类别；将概率最大值所对应的类别与真实标签类别进行自适应的交叉熵损失值计算。

10.尺度自适应特征增强深度神经网络的图像分割系统，其特征在于，包括：