CN112560577A - 一种基于语义分割的遥感图像地物分类方法 - Google Patents

一种基于语义分割的遥感图像地物分类方法 Download PDF

Info

Publication number
CN112560577A
CN112560577A CN202011265537.2A CN202011265537A CN112560577A CN 112560577 A CN112560577 A CN 112560577A CN 202011265537 A CN202011265537 A CN 202011265537A CN 112560577 A CN112560577 A CN 112560577A
Authority
CN
China
Prior art keywords
layer
standard
semantic segmentation
remote sensing
output end
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011265537.2A
Other languages
English (en)
Inventor
李潇
熊洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Space Information Industry Development Co ltd
Original Assignee
Space Information Industry Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Space Information Industry Development Co ltd filed Critical Space Information Industry Development Co ltd
Priority to CN202011265537.2A priority Critical patent/CN112560577A/zh
Publication of CN112560577A publication Critical patent/CN112560577A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于语义分割的遥感图像地物分类方法,包括以下步骤:S1、通过无人机采集地面物体的遥感图像,构建遥感图像集;S2、对采集的遥感图像集进行预处理,构建样本图像数据集,并将样本图像数据集划分为训练集和验证集;S3、构建神经网络语义分割模型;S4、将训练集输入神经网络语义分割模型中进行训练,并采用验证集对训练过程中的参数进行调整,得到训练完成的神经网络语义分割模型;S5、将待识别的遥感图像输入训练完成的神经网络语义分割模型中,得到地面物体分类结果,实现遥感图像的地物分类;本发明解决了现有的地物分类模型参数量大、训练时收敛时间长、模型泛化能力差和识别准确率低的问题。

Description

一种基于语义分割的遥感图像地物分类方法
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于语义分割的遥感图像地物分类方法。
背景技术
随着遥感技术的快速发展,遥感技术被越来越多的应用到测量、国土、农业、交通、林业、水利、军事等各个行业和领域,尤其是近年来高分辨率遥感卫星的出现,不仅极大地丰富了我们可以获取的地理信息,为未来测绘学科的发展提供了数据支撑,同时也为我们未来遥感科学的发展提供了新的方向。高分辨率遥感图像通常包含道路、水域、建筑、树木、农作物、车辆、行人等地物类别丰富的细节信息。遥感图像分割一直是视觉和遥感领域最重要和具有挑战的问题之一,遥感图像分割技术通过图像解译和分类的过程获得地物类别信息,为国民经济的发展和地理信息系统的建立提供了基础。
长期以来,遥感图像信息提取仍然停留在人工目视解译阶段,不仅自动化程度低、耗时长,而且需要大量的人力物力。传统的无监督聚类方法和机器学习方法很难充分利用影像的空间特征,无法实现高精度的地物分割。普通的像元分类方法,如支持向量机(SVM)和随机森林(RF)等,只能提取出像元统计特征和植被指数特征,无法得到遥感影像中丰富的空间信息,特征表达能力有限,得到的分割结果边缘较为粗糙,识别精度不高。传统的图像分割方法仍需要人工辅助控制,自动化程度不高,准确率较低,时间成本相对较高,并且难以在大规模部署和实时环境下应用。
近年来,计算机软硬件水平和数字图像处理技术迅速发展,尤其是深度学习理论的重大突破和持续发展,为遥感图像的自动解译提供了可能。基于深度学习理论,尤其是语义分割技术,实现对遥感图像的准确和快速分割,具有重要的研究意义和应用价值。但是目前这些技术在遥感图像语义分割模型的识别精度和泛化能力上表现较差,而且模型参数量大,训练时间较长。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于语义分割的遥感图像地物分类方法解决了现有的地物分类模型参数量大、训练时收敛时间长、模型泛化能力差和识别准确率低的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种基于语义分割的遥感图像地物分类方法,包括以下步骤:
S1、通过无人机采集地面物体的遥感图像,构建遥感图像集;
S2、对采集的遥感图像集进行预处理,构建样本图像数据集,并将样本图像数据集划分为训练集和验证集;
S3、构建神经网络语义分割模型;
S4、将训练集输入神经网络语义分割模型中进行训练,并采用验证集对训练过程中的参数进行调整,得到训练完成的神经网络语义分割模型;
S5、将待识别的遥感图像输入训练完成的神经网络语义分割模型中,得到地面物体分类结果,实现遥感图像的地物分类。
进一步地:步骤S2包括以下分步骤:
S21、对遥感图像集中每一张图像进行分割,得到尺寸统一的128*128的图像块;
S22、对图像块进行像素粒度的人工标注处理,得到标注图像集;
S23、对标注图像集进行扩充操作,得到样本图像数据集;
S24、将样本图像数据集划分为训练集和验证集。
进一步地:步骤S22中对图像块进行像素粒度的人工标注处理的方法为:
采用Labelme工具,对每个图像块中的植被、建筑、水体及道路进行标注命名,得到label.json文件的标注图像集。
进一步地:步骤S23中对标注图像集进行扩充操作的方法为:以水平、左右和沿对角线这三种角度对标注图像进行翻转,将翻转后的标注图像进行模糊处理、叠加噪声处理和色彩调整处理,得到样本图像数据集。
进一步地:步骤S3中神经网络语义分割模型包括:第一标准卷积层*3、第一池化层、第二标准卷积层*3、第二池化层、第三标准卷积层*3、第三池化层、第四标准卷积层*3、第四池化层、第五标准卷积层*3、第五池化层、第六标准卷积层、第七标准卷积层、第一反卷积层、第八标准卷积层*2、第二反卷积层、第九标准卷积层*2、第三反卷积层、第十标准卷积层*2、第四反卷积层、第十一标准卷积层*2、第五反卷积层、第十二标准卷积层*2和第一输出卷积层;
所述第一标准卷积层*3的输入端作为神经网络语义分割模型的输入端,其输出端分别与第一池化层的输入端、第十二标准卷积层*2的输入端和第五反卷积层的输出端连接;所述第一池化层的输出端与第二标准卷积层*3的输入端连接;所述第二标准卷积层*3的输出端分别与第二池化层的输入端、第十一标准卷积层*2的输入端和第四反卷积层的输出端连接;所述第二池化层的输出端与第三标准卷积层*3的输入端连接;所述第三标准卷积层*3的输出端分别与第三池化层的输入端、第十标准卷积层*2的输入端和第三反卷积层的输出端连接;所述第三池化层的输出端与第四标准卷积层*3的输入端连接;所述第四标准卷积层*3的输出端分别与第四池化层的输入端、第九标准卷积层*2的输入端和第二反卷积层的输出端连接;所述第四池化层的输出端与第五标准卷积层*3的输入端连接;所述第五标准卷积层*3的输出端分别与第五池化层的输入端、第八标准卷积层*2的输入端和第一反卷积层的输出端连接;所述第五池化层的输出端与第六标准卷积层的输入端连接;所述第六标准卷积层的输出端与第七标准卷积层的输入端连接;所述第七标准卷积层的输出端与第一反卷积层的输入端连接;所述第八标准卷积层*2的输出端与第二反卷积层的输入端连接;所述第九标准卷积层*2的输出端与第三反卷积层的输入端连接;所述第十标准卷积层*2的输出端与第四反卷积层的输入端连接;所述第十一标准卷积层*2的输出端与第五反卷积层的输入端连接;所述第十二标准卷积层*2的输出端与第一输出卷积层的输入端连接;所述第一输出卷积层的输出端作为神经网络语义分割模型的输出端。
进一步地:第一标准卷积层*3、第二标准卷积层*3、第三标准卷积层*3、第四标准卷积层*3和第五标准卷积层*3均为:3个依次连接的标准卷积层;
所述第六标准卷积层和第七标准卷积层均为1个标准卷积层;
所述第八标准卷积层*2、第九标准卷积层*2、第十标准卷积层*2、第十一标准卷积层*2和第十二标准卷积层*2均为:2个依次连接的标准卷积层;
所述标准卷积层均包括:依次连接的批标准化层、3*3卷积层和ELU激活函数层;
所述第一池化层、第二池化层、第三池化层、第四池化层和第五池化层均为2*2的最大池化层;
所述第一反卷积层、第二反卷积层、第三反卷积层、第四反卷积层和第五反卷积层均为2*2反卷积层;
所述第一输出卷积层为1*1卷积层。
所述3*3卷积层和1*1卷积层的过滤器尺寸均为3*3*64,单位步长,零填充,所述第一反卷积层、第二反卷积层、第三反卷积层、第四反卷积层和第五反卷积层的过滤器尺寸均为2*2*64,输出尺寸是输入尺寸的2倍,步长为2,零填充;所述第一池化层、第二池化层、第三池化层、第四池化层和第五池化层的过滤器尺寸均为2*2,步长为2。
过滤器的深度统一设置为64,使得网络结构更加清晰,并降低了时间和空间复杂度,同时由于待识别数据集中类别数和待识别特征数较少,过滤器深度不会影响模型实际预测性能。
进一步地:批标准化层的输入输出关系为:
Figure BDA0002775977160000051
其中,
Figure BDA0002775977160000052
为标准化后批标准化层的输出,xi为批标准化层的输入,m为输入的xi的总数,i为第i输入图像数据,ε为标准化参数。
进一步地:ELU激活函数层的ELU激活函数为:
Figure BDA0002775977160000053
其中,f(x)为ELU激活函数,x为ELU激活函数层的输入,α为激活参数。
上述进一步方案的有益效果为:ELU函数当输入负值时,具有软饱和性,对输入变化或噪声不敏感;当输入正值时,其导数恒为1,能够缓解网络训练过程中出现的梯度弥散现象,又ELU的输出均值接近于0,可以加速网络收敛。
进一步地:步骤S4包括以下分步骤:
S41、将训练集划分为多个批次的训练数据;
S42、将每个批次的训练数据依次输入神经网络语义分割模型中,采用交叉熵损失函数和Adam优化器对神经网络语义分割模型进行训练,并采用验证集对训练过程中的参数进行调整,得到训练完成的神经网络语义分割模型。
进一步地:步骤S4中神经网络语义分割模型进行训练过程中,参数更新公式为:
Figure BDA0002775977160000061
其中,θt+1为第t+1次迭代的参数,θt为第t次迭代的参数,β1为第一指数衰减率,用于控制权重分配,β2为第二指数衰减率,用来控制梯度平方的影响情况,vt-1为第t-1次迭代的梯度的二阶矩,mt-1为t-1次迭代的梯度的一阶矩,gt为第t次迭代的梯度,
Figure BDA0002775977160000062
为常量。
上述进一步方案的有益效果为:通过参数更新公式,可以在训练神经网络时每一次迭代都会作偏置矫正,学习率在一定范围内变化,从而参数更新平稳,不容易出现梯度弥散或爆炸现象。
综上,本发明的有益效果为:一种基于语义分割的遥感图像地物分类方法中,网络在卷积操作前作批标准化处理,使用最大池化进行下采样,统一了过滤器深度(64),使用ELU替换原始ReLu激活函数来进行遥感图像的地物分类,改进模型的网络结构更加清晰,精简了模型的参数,更能在小样本的数据集上表现优异。本发明通过训练完成的神经网络语义分割模型作为遥感图像地物分类模型,提高了地物目标识别的准确率,精简了模型的参数,缓解了梯度弥散现象,模型具有更好地鲁棒性,并且减少了模型训练所需要的资源和时间。
附图说明
图1为一种基于语义分割的遥感图像地物分类方法的流程图;
图2为神经网络语义分割模型的结构示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,一种基于语义分割的遥感图像地物分类方法,包括以下步骤:
S1、通过无人机采集地面物体的遥感图像,构建遥感图像集;
S2、对采集的遥感图像集进行预处理,构建样本图像数据集,并将样本图像数据集划分为训练集和验证集;
步骤S2包括以下分步骤:
S21、对遥感图像集中每一张图像进行分割,得到尺寸统一的128*128的图像块;
S22、对图像块进行像素粒度的人工标注处理,得到标注图像集;
步骤S22中对图像块进行像素粒度的人工标注处理的方法为:
采用Labelme工具,对每个图像块中的植被、建筑、水体及道路进行标注命名,得到label.json文件的标注图像集。
S23、对标注图像集进行扩充操作,得到样本图像数据集;
步骤S23中对标注图像集进行扩充操作的方法为:以水平、左右和沿对角线这三种角度对标注图像进行翻转,将翻转后的标注图像进行模糊处理、叠加噪声处理和色彩调整处理,得到样本图像数据集。
S24、将样本图像数据集划分为训练集和验证集。
S3、构建神经网络语义分割模型;
如图2所示,步骤S3中神经网络语义分割模型包括:第一标准卷积层*3、第一池化层、第二标准卷积层*3、第二池化层、第三标准卷积层*3、第三池化层、第四标准卷积层*3、第四池化层、第五标准卷积层*3、第五池化层、第六标准卷积层、第七标准卷积层、第一反卷积层、第八标准卷积层*2、第二反卷积层、第九标准卷积层*2、第三反卷积层、第十标准卷积层*2、第四反卷积层、第十一标准卷积层*2、第五反卷积层、第十二标准卷积层*2和第一输出卷积层;
所述第一标准卷积层*3的输入端作为神经网络语义分割模型的输入端,其输出端分别与第一池化层的输入端、第十二标准卷积层*2的输入端和第五反卷积层的输出端连接;所述第一池化层的输出端与第二标准卷积层*3的输入端连接;所述第二标准卷积层*3的输出端分别与第二池化层的输入端、第十一标准卷积层*2的输入端和第四反卷积层的输出端连接;所述第二池化层的输出端与第三标准卷积层*3的输入端连接;所述第三标准卷积层*3的输出端分别与第三池化层的输入端、第十标准卷积层*2的输入端和第三反卷积层的输出端连接;所述第三池化层的输出端与第四标准卷积层*3的输入端连接;所述第四标准卷积层*3的输出端分别与第四池化层的输入端、第九标准卷积层*2的输入端和第二反卷积层的输出端连接;所述第四池化层的输出端与第五标准卷积层*3的输入端连接;所述第五标准卷积层*3的输出端分别与第五池化层的输入端、第八标准卷积层*2的输入端和第一反卷积层的输出端连接;所述第五池化层的输出端与第六标准卷积层的输入端连接;所述第六标准卷积层的输出端与第七标准卷积层的输入端连接;所述第七标准卷积层的输出端与第一反卷积层的输入端连接;所述第八标准卷积层*2的输出端与第二反卷积层的输入端连接;所述第九标准卷积层*2的输出端与第三反卷积层的输入端连接;所述第十标准卷积层*2的输出端与第四反卷积层的输入端连接;所述第十一标准卷积层*2的输出端与第五反卷积层的输入端连接;所述第十二标准卷积层*2的输出端与第一输出卷积层的输入端连接;所述第一输出卷积层的输出端作为神经网络语义分割模型的输出端。
第一标准卷积层*3、第二标准卷积层*3、第三标准卷积层*3、第四标准卷积层*3和第五标准卷积层*3均为:3个依次连接的标准卷积层;
所述第六标准卷积层和第七标准卷积层均为1个标准卷积层;
所述第八标准卷积层*2、第九标准卷积层*2、第十标准卷积层*2、第十一标准卷积层*2和第十二标准卷积层*2均为:2个依次连接的标准卷积层;
所述标准卷积层均包括:依次连接的批标准化层、3*3卷积层和ELU激活函数层;
所述第一池化层、第二池化层、第三池化层、第四池化层和第五池化层均为2*2的最大池化层;
所述第一反卷积层、第二反卷积层、第三反卷积层、第四反卷积层和第五反卷积层均为2*2反卷积层;
所述第一输出卷积层为1*1卷积层。
所述3*3卷积层和1*1卷积层的过滤器尺寸均为3*3*64,单位步长,零填充,所述第一反卷积层、第二反卷积层、第三反卷积层、第四反卷积层和第五反卷积层的过滤器尺寸均为2*2*64,输出尺寸是输入尺寸的2倍,步长为2,零填充;所述第一池化层、第二池化层、第三池化层、第四池化层和第五池化层的过滤器尺寸均为2*2,步长为2。
过滤器的深度统一设置为64,使得网络结构更加清晰,并降低了时间和空间复杂度,同时由于待识别数据集中类别数和待识别特征数较少,过滤器深度不会影响模型实际预测性能。
批标准化层的输入输出关系为:
Figure BDA0002775977160000091
其中,
Figure BDA0002775977160000092
为标准化后批标准化层的输出,xi为批标准化层的输入,m为输入的xi的总数,i为第i输入图像数据,ε为标准化参数。
ELU激活函数层的ELU激活函数为:
Figure BDA0002775977160000101
其中,f(x)为ELU激活函数,x为ELU激活函数层的输入,α为激活参数。
S4、将训练集输入神经网络语义分割模型中进行训练,并采用验证集对训练过程中的参数进行调整,得到训练完成的神经网络语义分割模型;
步骤S4包括以下分步骤:
S41、将训练集划分为多个批次的训练数据;
S42、将每个批次的训练数据依次输入神经网络语义分割模型中,采用交叉熵损失函数和Adam优化器对神经网络语义分割模型进行训练,并采用验证集对训练过程中的参数进行调整,得到训练完成的神经网络语义分割模型。
步骤S4中神经网络语义分割模型进行训练过程中,参数更新公式为:
Figure BDA0002775977160000102
其中,θt+1为第t+1次迭代的参数,θt为第t次迭代的参数,β1为第一指数衰减率,用于控制权重分配,β2为第二指数衰减率,用来控制梯度平方的影响情况,vt-1为第t-1次迭代的梯度的二阶矩,mt-1为t-1次迭代的梯度的一阶矩,gt为第t次迭代的梯度,
Figure BDA0002775977160000103
为常量。
S5、将待识别的遥感图像输入训练完成的神经网络语义分割模型中,得到地面物体分类结果,实现遥感图像的地物分类。

Claims (10)

1.一种基于语义分割的遥感图像地物分类方法,其特征在于,包括以下步骤:
S1、通过无人机采集地面物体的遥感图像,构建遥感图像集;
S2、对采集的遥感图像集进行预处理,构建样本图像数据集,并将样本图像数据集划分为训练集和验证集;
S3、构建神经网络语义分割模型;
S4、将训练集输入神经网络语义分割模型中进行训练,并采用验证集对训练过程中的参数进行调整,得到训练完成的神经网络语义分割模型;
S5、将待识别的遥感图像输入训练完成的神经网络语义分割模型中,得到地面物体分类结果,实现遥感图像的地物分类。
2.根据权利要求1所述的基于语义分割的遥感图像地物分类方法,其特征在于,所述步骤S2包括以下分步骤:
S21、对遥感图像集中每一张图像进行分割,得到尺寸统一的128*128的图像块;
S22、对图像块进行像素粒度的人工标注处理,得到标注图像集;
S23、对标注图像集进行扩充操作,得到样本图像数据集;
S24、将样本图像数据集划分为训练集和验证集。
3.根据权利要求1所述的基于语义分割的遥感图像地物分类方法,其特征在于,所述步骤S22中对图像块进行像素粒度的人工标注处理的方法为:
采用Labelme工具,对每个图像块中的植被、建筑、水体及道路进行标注命名,得到label.json文件的标注图像集。
4.根据权利要求1所述的基于语义分割的遥感图像地物分类方法,其特征在于,所述步骤S23中对标注图像集进行扩充操作的方法为:以水平、左右和沿对角线这三种角度对标注图像进行翻转,将翻转后的标注图像进行模糊处理、叠加噪声处理和色彩调整处理,得到样本图像数据集。
5.根据权利要求1所述的基于语义分割的遥感图像地物分类方法,其特征在于,所述步骤S3中神经网络语义分割模型包括:第一标准卷积层*3、第一池化层、第二标准卷积层*3、第二池化层、第三标准卷积层*3、第三池化层、第四标准卷积层*3、第四池化层、第五标准卷积层*3、第五池化层、第六标准卷积层、第七标准卷积层、第一反卷积层、第八标准卷积层*2、第二反卷积层、第九标准卷积层*2、第三反卷积层、第十标准卷积层*2、第四反卷积层、第十一标准卷积层*2、第五反卷积层、第十二标准卷积层*2和第一输出卷积层;
所述第一标准卷积层*3的输入端作为神经网络语义分割模型的输入端,其输出端分别与第一池化层的输入端、第十二标准卷积层*2的输入端和第五反卷积层的输出端连接;所述第一池化层的输出端与第二标准卷积层*3的输入端连接;所述第二标准卷积层*3的输出端分别与第二池化层的输入端、第十一标准卷积层*2的输入端和第四反卷积层的输出端连接;所述第二池化层的输出端与第三标准卷积层*3的输入端连接;所述第三标准卷积层*3的输出端分别与第三池化层的输入端、第十标准卷积层*2的输入端和第三反卷积层的输出端连接;所述第三池化层的输出端与第四标准卷积层*3的输入端连接;所述第四标准卷积层*3的输出端分别与第四池化层的输入端、第九标准卷积层*2的输入端和第二反卷积层的输出端连接;所述第四池化层的输出端与第五标准卷积层*3的输入端连接;所述第五标准卷积层*3的输出端分别与第五池化层的输入端、第八标准卷积层*2的输入端和第一反卷积层的输出端连接;所述第五池化层的输出端与第六标准卷积层的输入端连接;所述第六标准卷积层的输出端与第七标准卷积层的输入端连接;所述第七标准卷积层的输出端与第一反卷积层的输入端连接;所述第八标准卷积层*2的输出端与第二反卷积层的输入端连接;所述第九标准卷积层*2的输出端与第三反卷积层的输入端连接;所述第十标准卷积层*2的输出端与第四反卷积层的输入端连接;所述第十一标准卷积层*2的输出端与第五反卷积层的输入端连接;所述第十二标准卷积层*2的输出端与第一输出卷积层的输入端连接;所述第一输出卷积层的输出端作为神经网络语义分割模型的输出端。
6.根据权利要求5所述的基于语义分割的遥感图像地物分类方法,其特征在于,所述第一标准卷积层*3、第二标准卷积层*3、第三标准卷积层*3、第四标准卷积层*3和第五标准卷积层*3均为:3个依次连接的标准卷积层;
所述第六标准卷积层和第七标准卷积层均为1个标准卷积层;
所述第八标准卷积层*2、第九标准卷积层*2、第十标准卷积层*2、第十一标准卷积层*2和第十二标准卷积层*2均为:2个依次连接的标准卷积层;所述标准卷积层均包括:依次连接的批标准化层、3*3卷积层和ELU激活函数层;
所述第一池化层、第二池化层、第三池化层、第四池化层和第五池化层均为2*2的最大池化层;所述第一反卷积层、第二反卷积层、第三反卷积层、第四反卷积层和第五反卷积层均为2*2反卷积层;
所述第一输出卷积层为1*1卷积层。
7.根据权利要求6所述的基于语义分割的遥感图像地物分类方法,其特征在于,所述批标准化层的输入输出关系为:
Figure FDA0002775977150000031
其中,
Figure FDA0002775977150000032
为标准化后批标准化层的输出,xi为批标准化层的输入,m为输入的xi的总数,i为第i输入图像数据,ε为标准化参数。
8.根据权利要求6所述的基于语义分割的遥感图像地物分类方法,其特征在于,所述ELU激活函数层的ELU激活函数为:
Figure FDA0002775977150000041
其中,f(x)为ELU激活函数,x为ELU激活函数层的输入,α为激活参数。
9.根据权利要求1所述的基于语义分割的遥感图像地物分类方法,其特征在于,所述步骤S4包括以下分步骤:
S41、将训练集划分为多个批次的训练数据;
S42、将每个批次的训练数据依次输入神经网络语义分割模型中,采用交叉熵损失函数和Adam优化器对神经网络语义分割模型进行训练,并采用验证集对训练过程中的参数进行调整,得到训练完成的神经网络语义分割模型。
10.根据权利要求1所述的基于语义分割的遥感图像地物分类方法,其特征在于,所述步骤S4中神经网络语义分割模型进行训练过程中,参数更新公式为:
Figure FDA0002775977150000042
其中,θt+1为第t+1次迭代的参数,θt为第t次迭代的参数,β1为第一指数衰减率,用于控制权重分配,β2为第二指数衰减率,用来控制梯度平方的影响情况,vt-1为第t-1次迭代的梯度的二阶矩,mt-1为t-1次迭代的梯度的一阶矩,gt为第t次迭代的梯度,
Figure FDA0002775977150000043
为常量。
CN202011265537.2A 2020-11-13 2020-11-13 一种基于语义分割的遥感图像地物分类方法 Pending CN112560577A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011265537.2A CN112560577A (zh) 2020-11-13 2020-11-13 一种基于语义分割的遥感图像地物分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011265537.2A CN112560577A (zh) 2020-11-13 2020-11-13 一种基于语义分割的遥感图像地物分类方法

Publications (1)

Publication Number Publication Date
CN112560577A true CN112560577A (zh) 2021-03-26

Family

ID=75042169

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011265537.2A Pending CN112560577A (zh) 2020-11-13 2020-11-13 一种基于语义分割的遥感图像地物分类方法

Country Status (1)

Country Link
CN (1) CN112560577A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114494910A (zh) * 2022-04-18 2022-05-13 陕西自然资源勘测规划设计院有限公司 一种基于遥感图像的设施农用地多类别识别与分类方法
WO2023000159A1 (zh) * 2021-07-20 2023-01-26 海南长光卫星信息技术有限公司 高分辨率遥感影像半监督分类方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109389051A (zh) * 2018-09-20 2019-02-26 华南农业大学 一种基于卷积神经网络的建筑物遥感图像识别方法
CN111259900A (zh) * 2020-01-13 2020-06-09 河海大学 一种卫星遥感图像的语义分割方法
CN111640087A (zh) * 2020-04-14 2020-09-08 中国测绘科学研究院 一种基于sar深度全卷积神经网络的影像变化检测方法
US20200320273A1 (en) * 2017-12-26 2020-10-08 Beijing Sensetime Technology Development Co., Ltd. Remote sensing image recognition method and apparatus, storage medium and electronic device
CN111797703A (zh) * 2020-06-11 2020-10-20 武汉大学 基于鲁棒深度语义分割网络的多源遥感影像分类方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200320273A1 (en) * 2017-12-26 2020-10-08 Beijing Sensetime Technology Development Co., Ltd. Remote sensing image recognition method and apparatus, storage medium and electronic device
CN109389051A (zh) * 2018-09-20 2019-02-26 华南农业大学 一种基于卷积神经网络的建筑物遥感图像识别方法
CN111259900A (zh) * 2020-01-13 2020-06-09 河海大学 一种卫星遥感图像的语义分割方法
CN111640087A (zh) * 2020-04-14 2020-09-08 中国测绘科学研究院 一种基于sar深度全卷积神经网络的影像变化检测方法
CN111797703A (zh) * 2020-06-11 2020-10-20 武汉大学 基于鲁棒深度语义分割网络的多源遥感影像分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
魏芳: "基于语义分割的车载路面裂缝自动识别技术研究", 中国优秀硕士学位论文全文数据库 工程科技II辑, no. 01, pages 034 - 383 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023000159A1 (zh) * 2021-07-20 2023-01-26 海南长光卫星信息技术有限公司 高分辨率遥感影像半监督分类方法、装置、设备及介质
CN114494910A (zh) * 2022-04-18 2022-05-13 陕西自然资源勘测规划设计院有限公司 一种基于遥感图像的设施农用地多类别识别与分类方法
CN114494910B (zh) * 2022-04-18 2022-09-06 陕西自然资源勘测规划设计院有限公司 一种基于遥感图像的设施农用地多类别识别与分类方法

Similar Documents

Publication Publication Date Title
CN108985238B (zh) 联合深度学习和语义概率的不透水面提取方法及系统
CN111783782B (zh) 融合改进UNet和SegNet的遥感图像语义分割方法
CN111160127B (zh) 一种基于深度卷积神经网络模型的遥感影像处理及检测方法
CN112991354B (zh) 一种基于深度学习的高分辨率遥感影像语义分割方法
CN108428220B (zh) 静止轨道卫星序列遥感影像海岛礁区域自动几何校正方法
CN111259827B (zh) 一种面向城市河道监管的水面漂浮物自动检测方法及装置
CN111985274B (zh) 一种基于卷积神经网络的遥感图像分割方法
CN112347970B (zh) 一种基于图卷积神经网络的遥感影像地物识别方法
CN111079847B (zh) 一种基于深度学习的遥感影像自动标注方法
CN112560577A (zh) 一种基于语义分割的遥感图像地物分类方法
CN109241995A (zh) 一种基于改进型ArcFace损失函数的图像识别方法
CN110807485B (zh) 基于高分遥感影像二分类语义分割图融合成多分类语义图的方法
Lv et al. Deep learning model of image classification using machine learning
CN112906666A (zh) 一种农业种植结构的遥感识别方法
CN111178438A (zh) 一种基于ResNet101的天气类型识别方法
CN112001293A (zh) 结合多尺度信息和编解码网络的遥感影像地物分类方法
CN111461006A (zh) 一种基于深度迁移学习的光学遥感图像杆塔位置检测方法
CN116228789A (zh) 一种基于DeepLabv3+网络的遥感图像分割方法
CN106971402B (zh) 一种基于光学辅助的sar图像变化检测方法
CN117132884A (zh) 一种基于地块尺度的农作物遥感智能提取方法
CN1472634A (zh) 高光谱遥感图像联合加权随机分类方法
Zhang et al. Road extraction from multi-source high-resolution remote sensing image using convolutional neural network
CN106355196A (zh) 基于耦合字典学习的合成孔径雷达图像目标识别方法
CN113627480B (zh) 一种基于强化学习的极化sar影像分类方法
Yang et al. Extraction of land covers from remote sensing images based on a deep learning model of NDVI-RSU-Net

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination