CN112560577A

CN112560577A - 一种基于语义分割的遥感图像地物分类方法

Info

Publication number: CN112560577A
Application number: CN202011265537.2A
Authority: CN
Inventors: 李潇; 熊洋
Original assignee: Space Information Industry Development Co ltd
Current assignee: Space Information Industry Development Co ltd
Priority date: 2020-11-13
Filing date: 2020-11-13
Publication date: 2021-03-26

Abstract

本发明公开了一种基于语义分割的遥感图像地物分类方法，包括以下步骤：S1、通过无人机采集地面物体的遥感图像，构建遥感图像集；S2、对采集的遥感图像集进行预处理，构建样本图像数据集，并将样本图像数据集划分为训练集和验证集；S3、构建神经网络语义分割模型；S4、将训练集输入神经网络语义分割模型中进行训练，并采用验证集对训练过程中的参数进行调整，得到训练完成的神经网络语义分割模型；S5、将待识别的遥感图像输入训练完成的神经网络语义分割模型中，得到地面物体分类结果，实现遥感图像的地物分类；本发明解决了现有的地物分类模型参数量大、训练时收敛时间长、模型泛化能力差和识别准确率低的问题。

Description

一种基于语义分割的遥感图像地物分类方法

技术领域

本发明涉及图像处理技术领域，具体涉及一种基于语义分割的遥感图像地物分类方法。

背景技术

随着遥感技术的快速发展，遥感技术被越来越多的应用到测量、国土、农业、交通、林业、水利、军事等各个行业和领域，尤其是近年来高分辨率遥感卫星的出现，不仅极大地丰富了我们可以获取的地理信息，为未来测绘学科的发展提供了数据支撑，同时也为我们未来遥感科学的发展提供了新的方向。高分辨率遥感图像通常包含道路、水域、建筑、树木、农作物、车辆、行人等地物类别丰富的细节信息。遥感图像分割一直是视觉和遥感领域最重要和具有挑战的问题之一，遥感图像分割技术通过图像解译和分类的过程获得地物类别信息，为国民经济的发展和地理信息系统的建立提供了基础。

长期以来，遥感图像信息提取仍然停留在人工目视解译阶段，不仅自动化程度低、耗时长，而且需要大量的人力物力。传统的无监督聚类方法和机器学习方法很难充分利用影像的空间特征，无法实现高精度的地物分割。普通的像元分类方法，如支持向量机(SVM)和随机森林(RF)等，只能提取出像元统计特征和植被指数特征，无法得到遥感影像中丰富的空间信息，特征表达能力有限，得到的分割结果边缘较为粗糙，识别精度不高。传统的图像分割方法仍需要人工辅助控制，自动化程度不高，准确率较低，时间成本相对较高，并且难以在大规模部署和实时环境下应用。

近年来，计算机软硬件水平和数字图像处理技术迅速发展，尤其是深度学习理论的重大突破和持续发展，为遥感图像的自动解译提供了可能。基于深度学习理论，尤其是语义分割技术，实现对遥感图像的准确和快速分割，具有重要的研究意义和应用价值。但是目前这些技术在遥感图像语义分割模型的识别精度和泛化能力上表现较差，而且模型参数量大，训练时间较长。

发明内容

针对现有技术中的上述不足，本发明提供的一种基于语义分割的遥感图像地物分类方法解决了现有的地物分类模型参数量大、训练时收敛时间长、模型泛化能力差和识别准确率低的问题。

为了达到上述发明目的，本发明采用的技术方案为：一种基于语义分割的遥感图像地物分类方法，包括以下步骤：

S1、通过无人机采集地面物体的遥感图像，构建遥感图像集；

S2、对采集的遥感图像集进行预处理，构建样本图像数据集，并将样本图像数据集划分为训练集和验证集；

S3、构建神经网络语义分割模型；

S4、将训练集输入神经网络语义分割模型中进行训练，并采用验证集对训练过程中的参数进行调整，得到训练完成的神经网络语义分割模型；

S5、将待识别的遥感图像输入训练完成的神经网络语义分割模型中，得到地面物体分类结果，实现遥感图像的地物分类。

进一步地：步骤S2包括以下分步骤：

S21、对遥感图像集中每一张图像进行分割，得到尺寸统一的128*128的图像块；

S22、对图像块进行像素粒度的人工标注处理，得到标注图像集；

S23、对标注图像集进行扩充操作，得到样本图像数据集；

S24、将样本图像数据集划分为训练集和验证集。

进一步地：步骤S22中对图像块进行像素粒度的人工标注处理的方法为：

采用Labelme工具，对每个图像块中的植被、建筑、水体及道路进行标注命名，得到label.json文件的标注图像集。

进一步地：步骤S23中对标注图像集进行扩充操作的方法为：以水平、左右和沿对角线这三种角度对标注图像进行翻转，将翻转后的标注图像进行模糊处理、叠加噪声处理和色彩调整处理，得到样本图像数据集。

进一步地：步骤S3中神经网络语义分割模型包括：第一标准卷积层*3、第一池化层、第二标准卷积层*3、第二池化层、第三标准卷积层*3、第三池化层、第四标准卷积层*3、第四池化层、第五标准卷积层*3、第五池化层、第六标准卷积层、第七标准卷积层、第一反卷积层、第八标准卷积层*2、第二反卷积层、第九标准卷积层*2、第三反卷积层、第十标准卷积层*2、第四反卷积层、第十一标准卷积层*2、第五反卷积层、第十二标准卷积层*2和第一输出卷积层；

所述第一标准卷积层*3的输入端作为神经网络语义分割模型的输入端，其输出端分别与第一池化层的输入端、第十二标准卷积层*2的输入端和第五反卷积层的输出端连接；所述第一池化层的输出端与第二标准卷积层*3的输入端连接；所述第二标准卷积层*3的输出端分别与第二池化层的输入端、第十一标准卷积层*2的输入端和第四反卷积层的输出端连接；所述第二池化层的输出端与第三标准卷积层*3的输入端连接；所述第三标准卷积层*3的输出端分别与第三池化层的输入端、第十标准卷积层*2的输入端和第三反卷积层的输出端连接；所述第三池化层的输出端与第四标准卷积层*3的输入端连接；所述第四标准卷积层*3的输出端分别与第四池化层的输入端、第九标准卷积层*2的输入端和第二反卷积层的输出端连接；所述第四池化层的输出端与第五标准卷积层*3的输入端连接；所述第五标准卷积层*3的输出端分别与第五池化层的输入端、第八标准卷积层*2的输入端和第一反卷积层的输出端连接；所述第五池化层的输出端与第六标准卷积层的输入端连接；所述第六标准卷积层的输出端与第七标准卷积层的输入端连接；所述第七标准卷积层的输出端与第一反卷积层的输入端连接；所述第八标准卷积层*2的输出端与第二反卷积层的输入端连接；所述第九标准卷积层*2的输出端与第三反卷积层的输入端连接；所述第十标准卷积层*2的输出端与第四反卷积层的输入端连接；所述第十一标准卷积层*2的输出端与第五反卷积层的输入端连接；所述第十二标准卷积层*2的输出端与第一输出卷积层的输入端连接；所述第一输出卷积层的输出端作为神经网络语义分割模型的输出端。

进一步地：第一标准卷积层*3、第二标准卷积层*3、第三标准卷积层*3、第四标准卷积层*3和第五标准卷积层*3均为：3个依次连接的标准卷积层；

所述第六标准卷积层和第七标准卷积层均为1个标准卷积层；

所述第八标准卷积层*2、第九标准卷积层*2、第十标准卷积层*2、第十一标准卷积层*2和第十二标准卷积层*2均为：2个依次连接的标准卷积层；

所述标准卷积层均包括：依次连接的批标准化层、3*3卷积层和ELU激活函数层；

所述第一池化层、第二池化层、第三池化层、第四池化层和第五池化层均为2*2的最大池化层；

所述第一反卷积层、第二反卷积层、第三反卷积层、第四反卷积层和第五反卷积层均为2*2反卷积层；

所述第一输出卷积层为1*1卷积层。

所述3*3卷积层和1*1卷积层的过滤器尺寸均为3*3*64，单位步长，零填充，所述第一反卷积层、第二反卷积层、第三反卷积层、第四反卷积层和第五反卷积层的过滤器尺寸均为2*2*64，输出尺寸是输入尺寸的2倍，步长为2，零填充；所述第一池化层、第二池化层、第三池化层、第四池化层和第五池化层的过滤器尺寸均为2*2，步长为2。

过滤器的深度统一设置为64，使得网络结构更加清晰，并降低了时间和空间复杂度，同时由于待识别数据集中类别数和待识别特征数较少，过滤器深度不会影响模型实际预测性能。

进一步地：批标准化层的输入输出关系为：

其中，

为标准化后批标准化层的输出，x_i为批标准化层的输入，m为输入的x_i的总数，i为第i输入图像数据，ε为标准化参数。

进一步地：ELU激活函数层的ELU激活函数为：

其中，f(x)为ELU激活函数，x为ELU激活函数层的输入，α为激活参数。

上述进一步方案的有益效果为：ELU函数当输入负值时，具有软饱和性，对输入变化或噪声不敏感；当输入正值时，其导数恒为1，能够缓解网络训练过程中出现的梯度弥散现象，又ELU的输出均值接近于0，可以加速网络收敛。

进一步地：步骤S4包括以下分步骤：

S41、将训练集划分为多个批次的训练数据；

S42、将每个批次的训练数据依次输入神经网络语义分割模型中，采用交叉熵损失函数和Adam优化器对神经网络语义分割模型进行训练，并采用验证集对训练过程中的参数进行调整，得到训练完成的神经网络语义分割模型。

进一步地：步骤S4中神经网络语义分割模型进行训练过程中，参数更新公式为：

其中，θ_t+1为第t+1次迭代的参数，θ_t为第t次迭代的参数，β₁为第一指数衰减率，用于控制权重分配，β₂为第二指数衰减率，用来控制梯度平方的影响情况，v_t-1为第t-1次迭代的梯度的二阶矩，m_t-1为t-1次迭代的梯度的一阶矩，g_t为第t次迭代的梯度，

为常量。

上述进一步方案的有益效果为：通过参数更新公式，可以在训练神经网络时每一次迭代都会作偏置矫正，学习率在一定范围内变化，从而参数更新平稳，不容易出现梯度弥散或爆炸现象。

综上，本发明的有益效果为：一种基于语义分割的遥感图像地物分类方法中，网络在卷积操作前作批标准化处理，使用最大池化进行下采样，统一了过滤器深度(64)，使用ELU替换原始ReLu激活函数来进行遥感图像的地物分类，改进模型的网络结构更加清晰，精简了模型的参数，更能在小样本的数据集上表现优异。本发明通过训练完成的神经网络语义分割模型作为遥感图像地物分类模型，提高了地物目标识别的准确率，精简了模型的参数，缓解了梯度弥散现象，模型具有更好地鲁棒性，并且减少了模型训练所需要的资源和时间。

附图说明

图1为一种基于语义分割的遥感图像地物分类方法的流程图；

图2为神经网络语义分割模型的结构示意图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

如图1所示，一种基于语义分割的遥感图像地物分类方法，包括以下步骤：

步骤S2包括以下分步骤：

步骤S22中对图像块进行像素粒度的人工标注处理的方法为：

S23、对标注图像集进行扩充操作，得到样本图像数据集；

步骤S23中对标注图像集进行扩充操作的方法为：以水平、左右和沿对角线这三种角度对标注图像进行翻转，将翻转后的标注图像进行模糊处理、叠加噪声处理和色彩调整处理，得到样本图像数据集。

S24、将样本图像数据集划分为训练集和验证集。

S3、构建神经网络语义分割模型；

如图2所示，步骤S3中神经网络语义分割模型包括：第一标准卷积层*3、第一池化层、第二标准卷积层*3、第二池化层、第三标准卷积层*3、第三池化层、第四标准卷积层*3、第四池化层、第五标准卷积层*3、第五池化层、第六标准卷积层、第七标准卷积层、第一反卷积层、第八标准卷积层*2、第二反卷积层、第九标准卷积层*2、第三反卷积层、第十标准卷积层*2、第四反卷积层、第十一标准卷积层*2、第五反卷积层、第十二标准卷积层*2和第一输出卷积层；

第一标准卷积层*3、第二标准卷积层*3、第三标准卷积层*3、第四标准卷积层*3和第五标准卷积层*3均为：3个依次连接的标准卷积层；

所述第六标准卷积层和第七标准卷积层均为1个标准卷积层；

所述第一输出卷积层为1*1卷积层。

批标准化层的输入输出关系为：

其中，

ELU激活函数层的ELU激活函数为：

步骤S4包括以下分步骤：

S41、将训练集划分为多个批次的训练数据；

步骤S4中神经网络语义分割模型进行训练过程中，参数更新公式为：

为常量。

Claims

1.一种基于语义分割的遥感图像地物分类方法，其特征在于，包括以下步骤：

S3、构建神经网络语义分割模型；

2.根据权利要求1所述的基于语义分割的遥感图像地物分类方法，其特征在于，所述步骤S2包括以下分步骤：

S23、对标注图像集进行扩充操作，得到样本图像数据集；

S24、将样本图像数据集划分为训练集和验证集。

3.根据权利要求1所述的基于语义分割的遥感图像地物分类方法，其特征在于，所述步骤S22中对图像块进行像素粒度的人工标注处理的方法为：

4.根据权利要求1所述的基于语义分割的遥感图像地物分类方法，其特征在于，所述步骤S23中对标注图像集进行扩充操作的方法为：以水平、左右和沿对角线这三种角度对标注图像进行翻转，将翻转后的标注图像进行模糊处理、叠加噪声处理和色彩调整处理，得到样本图像数据集。

5.根据权利要求1所述的基于语义分割的遥感图像地物分类方法，其特征在于，所述步骤S3中神经网络语义分割模型包括：第一标准卷积层*3、第一池化层、第二标准卷积层*3、第二池化层、第三标准卷积层*3、第三池化层、第四标准卷积层*3、第四池化层、第五标准卷积层*3、第五池化层、第六标准卷积层、第七标准卷积层、第一反卷积层、第八标准卷积层*2、第二反卷积层、第九标准卷积层*2、第三反卷积层、第十标准卷积层*2、第四反卷积层、第十一标准卷积层*2、第五反卷积层、第十二标准卷积层*2和第一输出卷积层；

6.根据权利要求5所述的基于语义分割的遥感图像地物分类方法，其特征在于，所述第一标准卷积层*3、第二标准卷积层*3、第三标准卷积层*3、第四标准卷积层*3和第五标准卷积层*3均为：3个依次连接的标准卷积层；

所述第六标准卷积层和第七标准卷积层均为1个标准卷积层；

所述第八标准卷积层*2、第九标准卷积层*2、第十标准卷积层*2、第十一标准卷积层*2和第十二标准卷积层*2均为：2个依次连接的标准卷积层；所述标准卷积层均包括：依次连接的批标准化层、3*3卷积层和ELU激活函数层；

所述第一池化层、第二池化层、第三池化层、第四池化层和第五池化层均为2*2的最大池化层；所述第一反卷积层、第二反卷积层、第三反卷积层、第四反卷积层和第五反卷积层均为2*2反卷积层；

所述第一输出卷积层为1*1卷积层。

7.根据权利要求6所述的基于语义分割的遥感图像地物分类方法，其特征在于，所述批标准化层的输入输出关系为：

其中，

8.根据权利要求6所述的基于语义分割的遥感图像地物分类方法，其特征在于，所述ELU激活函数层的ELU激活函数为：

9.根据权利要求1所述的基于语义分割的遥感图像地物分类方法，其特征在于，所述步骤S4包括以下分步骤：

S41、将训练集划分为多个批次的训练数据；

10.根据权利要求1所述的基于语义分割的遥感图像地物分类方法，其特征在于，所述步骤S4中神经网络语义分割模型进行训练过程中，参数更新公式为：

为常量。