CN113449735A

CN113449735A - 一种超像素分割的语义分割方法及装置

Info

Publication number: CN113449735A
Application number: CN202110802462.5A
Authority: CN
Inventors: 许海涛; 许金燕; 林福宏; 周贤伟
Original assignee: University of Science and Technology Beijing USTB
Current assignee: University of Science and Technology Beijing USTB
Priority date: 2021-07-15
Filing date: 2021-07-15
Publication date: 2021-09-28
Anticipated expiration: 2041-07-15
Also published as: CN113449735B

Abstract

本申请公开了一种超像素分割的语义分割方法及装置，属于计算机视觉技术领域。该方法及装置为应用于机器人SLAM系统的高效语义分割方法。其中方法包括：提出一种多分支结合的特征提取算法模型，将图像通过不同的神经网络，获得两分支的特征图；设计了新型特征融合模块，使用一个卷积网络以训练学习如何叠加这两个网络来融合不同尺寸的特征，整合空间信息和语义信息；提出使用改进的超像素分割模块来获取边界分割细节，保留了图像的局部信息，又降低了图像分割的计算复杂度来辅助解决边界分割不精确的问题，以此来提高语义分割中的小目标的精确度，获得最终语义分割结果。

Description

一种超像素分割的语义分割方法及装置

技术领域

本发明涉及计算机视觉技术领域，特别是指一种超像素分割的语义分割的方法及装置。

背景技术

基于深度学习的图像语义分割方法可以有效提取图像丰富的利用深层计算模型来学习抽象的图像特征，可以有效提取图像中丰富的低级、中级、高级语义信息，并将语义信息结合分类器进行像素分类，因此通过研究实时高精度图像语义分割方法对具体场景进行语义分割，提取场景的语义信息，捕获上下文的信息，提高分割效果，具有提高工业生产效率、提高用户应用体验、降低设备成本的意义。对于VSLAM系统来说，研究将场景的语义信息应用其中，指导系统的特征选择，可以提高SLAM系统的鲁棒性，提升机器人人机交互能力。

现有的语义分割方法在图像整体分割准确率上已经到达相当不错的水平，但是现有的语义分割方法还面临着许多挑战，例如物体之间的重叠和遮挡使得物体的边缘不能清晰辨认、低层特征包含丰富的空间信息，高层的图像特征包含丰富的语义信息，两者应该如何融合等。

由于神经网络的发展,当前主流方法均采用了深度神经网络作为其主要框架,进一步提升性能，但是仍然存在物体边缘分割不清晰的问题。

发明内容

本发明实施例提供了一种超像素分割的语义分割方法及装置。所述技术方案如下：

一方面，提供了一种超像素分割的语义分割方法，该方法包括：

S1：将待分割图像分别输入语义分割模型的三个分支；

S2：通过第一分支以及第二分支对待分割图像分别进行特征提取；通过第一分支的特征提取层输出第一特征图；通过第二分支的特征提取层输出第二特征图；

S3：将第一特征图以及第二特征图进行特征融合，得到融合特征图；

S4：对融合特征图进行双线性插值放大，得到与待分割图像大小相等的初步分割图像；

S5：通过第三分支对待分割图像进行Mean shift算法预处理，得到预处理后的图像；

S6：通过超像素分割模块对预处理后的图像提取图像的边缘信息，得到n个像素块；

S7：将n个像素块作为掩膜，通过每块掩膜对初步分割图像进行边缘优化，得到最终分割图。

可选地，通过第一分支以及第二分支对待分割图像分别进行特征提取，通过第一分支的特征提取层输出第一特征图，通过第二分支的特征提取层输出第二特征图，包括：

S21：将待分割图像输入第一分支，通过卷积神经网络对待分割图像进行特征提取，输出第一特征图；

S22：将待分割图像输入第二分支，通过ResNet-34网络对待分割图像进行特征提取，输出第二特征图。

可选地，将第一特征图以及第二特征图进行特征融合，得到融合特征图，包括：

S31：通过双线性插值法对第二特征图进行上采样，得到与第一特征图相同空间大小的上采样图；

S32：将第一特征图以及上采样图在尺度空间纵向联接；

S33：通过1x1的卷积网络进行第一特征图和上采样图的信息整合，得到整合后特征图以及特征权重；

S34：通过批量归一化BN层以及线性整流函数ReLU层平衡整合后特征图的尺度；将特征权重与整合后特征图相加，得到融合后的融合特征图。

可选地，通过第三分支对待分割图像进行Mean shift算法预处理，得到预处理后的图像，包括：

S51：在待分割图像上选取一像素点作为样本，计算样本均值m(x)；

S52：计算样本均值以及与像素点相邻的像素点之间的偏移量，m(x)_x_i；

S53：当像素点与样本均值之间的偏移量小于给定误差ε，结束循环；

否则，令xi＝m(x)，重复执行S51-S53。

可选地，通过超像素分割模块对预处理后的图像提取图像的边缘信息，得到n个像素块，包括：

S61：根据要分割的超像素区域数k，进行聚类中心的初始化，其中，多个聚类中心在图像中均匀分布，聚类点之间的间隔为S：

C_k＝[l_k，a_k，b_k，x_k，y_k]^T

(1)

其中，C_k为聚类中心，l_k、a_k、b_k为Lab颜色空间中的分量；x_k、y_k为C_k在图像中的的横、纵坐标；

S62：遍历计算每个聚类中心的邻域像素点i的梯度大小，选择梯度最小的领域像素点i的位置取代上一个聚类中心；

S63：计算每个聚类中心与领域像素点i的距离，通过K-means算法迭代更新聚类中心；

S64：重复执行S61-S63，直至每个聚类中心的位置不再变化或达到预设的迭代次数，迭代停止；初步得到超像素；

S65：对初步得到的超像素进行多层迭代合并；

S66：计算超像素及其邻近超像素之间的色差

设定阈值

对色差

小于阈值

的超像素进行多层级迭代合并，生成像素块。

可选地，计算每个聚类中心与领域像素点i的距离，包括：

其中，C_k为聚类中某点与中心点的距离；d_c表示颜色聚类距离；d_s表示根据空间距离聚类；d_t为通过纹理特征计算出的纹理距离；l_i、a_i、b_i分别为点i在Lab色彩空间下的值；l_j、a_j、b_j分别为点j在Lab色彩空间下的值；x_i、y_i为点i在图像中的空间位置；x_j、y_j为点j在图像中的空间位置；m为空间和像素颜色的相对重要性的度量。

可选地，将n个像素块作为掩膜，通过每块掩膜对初步分割图像进行边缘优化，得到最终分割图，包括：

S71：对初步分割图像划分出需要优化的标签像素，通过掩膜对标签像素的覆盖率进行计算；

S72：当掩膜内只包含单标签像素，且覆盖率大于90％时，则将掩膜内的所有像素设置为标签像素；

S73：当掩膜内包含多标签像素时，通过计算每种标签像素的覆盖率，选择总覆盖率最大的标签像素填充掩膜内像素；

S74：生成最终优化后的语义分割图。

一方面，提供了一种超像素分割的语义分割装置，该装置应用于上述的超像素分割的语义分割方法；包括：

特征提取模块，用于通过第一分支以及第二分支对待分割图像分别进行特征提取；通过第一分支的特征提取层输出第一特征图；通过第二分支的特征提取层输出第二特征图；

特征融合模块，用于将第一特征图以及第二特征图进行特征融合，得到融合特征图；

插值放大模块，用于对融合特征图进行双线性插值放大，得到与待分割图像大小相等的初步分割图像；

预处理模块，用于通过第三分支对待分割图像进行Mean shift算法预处理，得到预处理后的图像；

超像素分割模块，用于通过超像素分割模块对预处理后的图像提取图像的边缘信息，得到n个像素块；

边缘优化模块，用于将n个像素块作为掩膜，通过每块掩膜对初步分割图像进行边缘优化，得到最终分割图。

可选地，特征提取模块包括：

卷积神经网络，用于对输入第一分支的待分割图像进行特征提取，输出第一特征图；

ResNet-34网络，用于对输入第二分支的待分割图像进行特征提取，输出第二特征图。

可选地，特征融合模块包括：

上采样子模块，用于通过双线性插值法对第二特征图进行上采样，得到与第一特征图相同空间大小的上采样图；

联接层，用于将第一特征图以及上采样图在尺度空间纵向联接；

信息整合子模块，用于通过1x1的卷积网络进行第一特征图和上采样图的信息整合，得到整合后特征图以及特征权重；

特征叠加子模块，用于通过BN层以及ReLU层平衡整合后特征图的尺度；将特征权重与整合后特征图相加，得到融合后的融合特征图。

本发明实施例提供的技术方案带来的有益效果至少包括：

上述方案中，通过语义分割模型得到初始的分割结果图，使用改进的超像素分割模块来获取边界分割细节，保留了图像的局部信息，又降低了图像分割的计算复杂度来辅助解决边界分割不精确的问题，提高了语义分割中的小目标的精确度；利用超像素分割图对粗糙结果图进行边缘优化，这样可以让网络充分的学习全局信息，获得最终语义分割结果。本发明提供的方法不仅能提供丰富准确的图像边缘信息，并对预测结果进行优化，还能大大提高分割算法的运行效率，有效的融合低层和高层的图像特征。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种超像素分割的语义分割方法的语义分割优化系统模型图；

图2是本发明实施例提供的一种超像素分割的语义分割方法的特征提取流程图；

图3是本发明实施例提供的一种超像素分割的语义分割方法的特征融合流程图；

图4是本发明实施例提供的一种超像素分割的语义分割方法的预处理流程图；

图5是本实施例提供的一种超像素分割的语义分割方法的超像素分割MTS算法图；

图6是本实施例提供的一种超像素分割的语义分割方法的边缘优化流程图；

图7是本实施例提供的一种超像素分割的语义分割装置的语义分割装置框图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。

本发明实施例提供了一种超像素分割的语义分割方法及装置，该方法及装置主要是应用于机器人SLAM(Simultaneous localization and mapping，同步定位与建图)系统的高效语义分割方法，针对机器人SLAM系统构建语义地图语义信息缺失的问题，提出一种高效语义分割算法，提高机器人语义认知能力。如图1所示，为该方法的语义分割优化系统模型图。该方法包括：

S1：将待分割图像分别输入语义分割模型的三个分支；

在本实施例中，提出一种将SLIC算法和图像纹理特征结合的T-SLIC算法，首先经过Mean shift算法预处理，均值漂移后去除细小噪声点，然后进行超像素分割，为了解决SLIC算法对对纹理不敏感和边缘纹理复杂区域分割不精确的问题；提出了MTS算法和语义分割模型相结合的新型语义分割优化模型，进一步提高对细小目标的边缘分割能力，提升机器人SLAM系统对语义信息的理解。

如图2所示，为本实施例的特征提取流程图。通过第一分支以及第二分支对待分割图像分别进行特征提取；通过第一分支的特征提取层输出第一特征图，通过第二分支的特征提取层输出第二特征图，包括：

在本实施例中，输入图像至语义分割优化系统模型的神经网络框架，由于SLAM系统要求语义分割的实时性较高，因此本发明将待分割图像分为三个分支输入。

第一个分支输入到一个层数少的卷积神经网络CNN中。该网络只有4层，前3层的每一层包含一个步长为2的卷积层，每一个卷积层都有对应的批量归一化层BN和激活层ReLU；最后一层为一个“1x1”的卷积层，在保持特征图尺寸不变的情况下增加网络的线性特性，可增加网络的维度。

这样的设计能保证丰富的空间信息不丢失，由于网络结构被简化，提高了实时性。若输入的待分割图像的原始尺寸为W*H，输出的第一特征图的尺寸为原始待分割图像尺寸的W*H/8。

对于第二分支，本发明采用ResNet-34网络去除最大池化层和全连接层，将它分为五个模块，conv、Block1表示浅层、Block2表示中层、Block3和Block4表示高层特征提取模块，高层特征作为语义上下文信息提取模块的输入特征。为了提升网络的感受野，将ResNet-34网络的后两个模块Block3和Block4中的普通卷积替换为扩张卷积，这里的扩张卷积与普通卷积具有相同的参数，扩张率分别为2和4。在ResNet-34中，所有模块存在一个步长为2的卷积，使得最终输出的特征图大小为原始的待分割图像的1/32，由此得到第二特征图。

如图3所示，为本实施例的特征融合流程图。将第一特征图以及第二特征图进行特征融合，得到融合特征图，包括：

S32：将第一特征图以及上采样图在尺度空间纵向联接；

本实施例中，提出一种新型的特征融合结构，将不同尺寸的特征图进行特征融合。设计了一个卷积网络以训练学习如何叠加这两个网络来进行特征融合。如图2所示，为特征融合网络架构图。

本发明算法网络先将两路网络的输出在尺度空间上级联，通过双线性插值法对第二特征图进行上采样率为2的上采样，得到与第一特征图相同空间大小的上采样图，这样就可以在尺度空间上将上采样图与第一特征图纵向连接起来，利用一个“1x1”的卷积网络来实现第一特征图和上采样图的信息整合，然后使用对应的BN层和ReLU层来平衡特征的尺度；接着将特征权重与特征图相加，得到融合特征图。

对步骤S3得到的融合特征图进行双线性插值放大8倍后得到与原始的待分割图像大小相等的初步分割图像。

在本实施例中，通过第三分支对待分割图像进行Mean shift算法预处理，得到预处理后的图像，包括：

S52：计算样本均值以及与像素点相邻的像素点之间的偏移量，m(x)-x_i；

否则，令x_i＝m(x)，重复执行S51-S53。

在本实施例中，如图4所示，为本实施例的预处理流程图。经过Mean shift算法均值漂移后去除细小噪声点。

通过超像素分割模块对预处理后的图像提取图像的边缘信息，得到n个像素块，包括：

C_k＝[l_k，a_k，b_k，x_k，y_k]^T (1)

S65：对初步得到的超像素进行多层迭代合并；

S66：计算超像素及其邻近超像素之间的色差

设定阈值

对色差

小于阈值

的超像素进行多层级迭代合并，生成像素块。

在本实施例中，如图5所示，为本实施例的超像素分割MTS算法图。本发明提出的方法避免了在同一目标区域内确定过多聚类中心而导致过分割问题，利用超像素分割能将图像中颜色、纹理等属性相似的像素集合成超像素；为了解决SLIC算法对对纹理不敏感和边缘纹理复杂区域分割不精确的问题，超像素分割提供了丰富准确的图像边缘信息，还能大大提高分割算法的运行效率。

在本实施例中，在聚类时，综合考虑像素点与周围种子点的纹理、颜色和空间特征向量的距离，将像素点划分到特征向量距离最小的种子点中。本发明提出一种新的计算距离公式为：

计算每个聚类中心与领域像素点i的距离：

在本实施例中，需要计算超像素及其邻近的超像素之间的色差

设定一个阈值

对色差

小于阈值

的超像素进行多层级迭代合并。对于每一个超像素，其颜色均值的计算公式如下：

其中，

分别为超像素i中所有像素在l，a，b通道上的均值。

如图6所示，为本实施例的边缘优化流程图。将n个像素块作为掩膜，通过每块掩膜对初步分割图像进行边缘优化，得到最终分割图，包括：

S74：生成最终优化后的语义分割图。

本实施例中，提出一种生成掩膜的融合多层迭代合并的超像素分割方法为MTS算法。避免了在同一目标区域内确定过多聚类中心而导致的过分割现象，在继承SLIC方法简单、实用等优点的同时进一步提高了分割精度。

利用掩膜进行优化时总体可以分为两种情况，即标签像素在掩膜内和不在掩膜内。其中，若标签像素不在掩膜内可以直接忽略。

当标签像素在掩膜内也可以分为两种情况：即包含单标签像素和包含多标签像素；只包含单标签像素时，通过计算标签像素的覆盖率，若标签像素覆盖率大于90％，则将掩膜内所有像素设置为标签像素，若小于90％直接忽略。包含多标签像素时，首先计算每种标签像素的覆盖率，若总覆盖率小于90％直接忽略，反之利用覆盖率最大的标签像素填充掩膜内像素。

本发明实施例提供一种超像素分割的语义分割装置，该装置应用于上述的超像素分割的语义分割方法；如图7所示，为本实施例的语义分割装置框图，包括：

特征融合模块包括：

本实施例中，通过语义分割模型得到初始的分割结果图，利用超像素分割模块图对粗糙结果图进行边缘优化，这样可以让网络充分的学习全局信息，最终得到完整的分割结果图。不仅能提供丰富准确的图像边缘信息对预测结果进行优化，还能大大提高分割算法的运行效率，有效的融合低层和高层的图像特征。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种超像素分割的语义分割方法，其特征在于，所述方法包括：

S1：将待分割图像分别输入语义分割模型的三个分支；

S2：通过第一分支以及第二分支对所述待分割图像分别进行特征提取；通过所述第一分支的特征提取层输出第一特征图；通过所述第二分支的特征提取层输出第二特征图；

S3：将所述第一特征图以及第二特征图进行特征融合，得到融合特征图；

S4：对所述融合特征图进行双线性插值放大，得到与待分割图像大小相等的初步分割图像；

S5：通过第三分支对所述待分割图像进行Mean shift算法预处理，得到预处理后的图像；

S6：通过超像素分割模块对所述预处理后的图像提取图像的边缘信息，得到n个像素块；

S7：将所述n个像素块作为掩膜，通过每块掩膜对所述初步分割图像进行边缘优化，得到最终分割图。

2.根据权利要求1所述的超像素分割的语义分割方法，其特征在于，所述通过第一分支以及第二分支对所述待分割图像分别进行特征提取，通过所述第一分支的特征提取层输出第一特征图，通过所述第二分支的特征提取层输出第二特征图，包括：

3.根据权利要求1所述的超像素分割的语义分割方法，其特征在于，所述将所述第一特征图以及第二特征图进行特征融合，得到融合特征图，包括：

S31：通过双线性插值法对第二特征图进行上采样，得到与所述第一特征图相同空间大小的上采样图；

S32：将第一特征图以及上采样图在尺度空间纵向联接；

4.根据权利要求1所述的超像素分割的语义分割方法，其特征在于，所述通过第三分支对所述待分割图像进行Mean shift算法预处理，得到预处理后的图像，包括：

S52：计算样本均值以及与所述像素点相邻的像素点之间的偏移量，m(x)-x_i；

S53：当像素点与样本均值之间的偏移量小于给定误差ε，结束循环；否则，令x_i＝m(x)，重复执行S51-S53。

5.根据权利要求1所述的超像素分割的语义分割方法，其特征在于，所述通过超像素分割模块对所述预处理后的图像提取图像的边缘信息，得到n个像素块，包括：

C_k＝[l_k，a_k，b_k，x_k，y_k]^T (1)

S65：对初步得到的超像素进行多层迭代合并；

S66：计算超像素及其邻近超像素之间的色差

设定阈值

对色差

小于阈值

的超像素进行多层级迭代合并，生成像素块。

6.根据权利要求5所述的超像素分割的语义分割方法，其特征在于，所述计算每个聚类中心与领域像素点i的距离，包括：

7.根据权利要求1所述的超像素分割的语义分割方法，其特征在于，所述将n个像素块作为掩膜，通过每块掩膜对初步分割图像进行边缘优化，得到最终分割图，包括：

S74：生成最终优化后的最终分割图。

8.一种超像素分割的语义分割装置，其特征在于，所述装置应用于如权利要求1-7所述的超像素分割的语义分割方法；包括：

特征提取模块，用于通过第一分支以及第二分支对所述待分割图像分别进行特征提取；通过所述第一分支的特征提取层输出第一特征图；通过所述第二分支的特征提取层输出第二特征图；

特征融合模块，用于将所述第一特征图以及第二特征图进行特征融合，得到融合特征图；

预处理模块，用于通过第三分支对所述待分割图像进行Mean shift算法预处理，得到预处理后的图像；

超像素分割模块，用于通过超像素分割模块对所述预处理后的图像提取图像的边缘信息，得到n个像素块；

9.根据权利要求8所述的超像素分割的语义分割装置，其特征在于，所述特征提取模块包括：

10.根据权利要求9所述的超像素分割的语义分割装置，其特征在于，所述特征融合模块包括：

上采样子模块，用于通过双线性插值法对第二特征图进行上采样，得到与所述第一特征图相同空间大小的上采样图；