CN112560577A - 一种基于语义分割的遥感图像地物分类方法 - Google Patents
一种基于语义分割的遥感图像地物分类方法 Download PDFInfo
- Publication number
- CN112560577A CN112560577A CN202011265537.2A CN202011265537A CN112560577A CN 112560577 A CN112560577 A CN 112560577A CN 202011265537 A CN202011265537 A CN 202011265537A CN 112560577 A CN112560577 A CN 112560577A
- Authority
- CN
- China
- Prior art keywords
- layer
- standard
- semantic segmentation
- remote sensing
- output end
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000011218 segmentation Effects 0.000 title claims abstract description 63
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012549 training Methods 0.000 claims abstract description 43
- 238000013528 artificial neural network Methods 0.000 claims abstract description 40
- 238000012795 verification Methods 0.000 claims abstract description 14
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 238000011176 pooling Methods 0.000 claims description 54
- 230000004913 activation Effects 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 18
- 238000010606 normalization Methods 0.000 claims description 10
- 238000002372 labelling Methods 0.000 claims description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 5
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 238000013145 classification model Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 6
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 3
- 239000006185 dispersion Substances 0.000 description 3
- 238000003709 image segmentation Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Astronomy & Astrophysics (AREA)
- Remote Sensing (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于语义分割的遥感图像地物分类方法,包括以下步骤:S1、通过无人机采集地面物体的遥感图像,构建遥感图像集;S2、对采集的遥感图像集进行预处理,构建样本图像数据集,并将样本图像数据集划分为训练集和验证集;S3、构建神经网络语义分割模型;S4、将训练集输入神经网络语义分割模型中进行训练,并采用验证集对训练过程中的参数进行调整,得到训练完成的神经网络语义分割模型;S5、将待识别的遥感图像输入训练完成的神经网络语义分割模型中,得到地面物体分类结果,实现遥感图像的地物分类;本发明解决了现有的地物分类模型参数量大、训练时收敛时间长、模型泛化能力差和识别准确率低的问题。
Description
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于语义分割的遥感图像地物分类方法。
背景技术
随着遥感技术的快速发展,遥感技术被越来越多的应用到测量、国土、农业、交通、林业、水利、军事等各个行业和领域,尤其是近年来高分辨率遥感卫星的出现,不仅极大地丰富了我们可以获取的地理信息,为未来测绘学科的发展提供了数据支撑,同时也为我们未来遥感科学的发展提供了新的方向。高分辨率遥感图像通常包含道路、水域、建筑、树木、农作物、车辆、行人等地物类别丰富的细节信息。遥感图像分割一直是视觉和遥感领域最重要和具有挑战的问题之一,遥感图像分割技术通过图像解译和分类的过程获得地物类别信息,为国民经济的发展和地理信息系统的建立提供了基础。
长期以来,遥感图像信息提取仍然停留在人工目视解译阶段,不仅自动化程度低、耗时长,而且需要大量的人力物力。传统的无监督聚类方法和机器学习方法很难充分利用影像的空间特征,无法实现高精度的地物分割。普通的像元分类方法,如支持向量机(SVM)和随机森林(RF)等,只能提取出像元统计特征和植被指数特征,无法得到遥感影像中丰富的空间信息,特征表达能力有限,得到的分割结果边缘较为粗糙,识别精度不高。传统的图像分割方法仍需要人工辅助控制,自动化程度不高,准确率较低,时间成本相对较高,并且难以在大规模部署和实时环境下应用。
近年来,计算机软硬件水平和数字图像处理技术迅速发展,尤其是深度学习理论的重大突破和持续发展,为遥感图像的自动解译提供了可能。基于深度学习理论,尤其是语义分割技术,实现对遥感图像的准确和快速分割,具有重要的研究意义和应用价值。但是目前这些技术在遥感图像语义分割模型的识别精度和泛化能力上表现较差,而且模型参数量大,训练时间较长。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于语义分割的遥感图像地物分类方法解决了现有的地物分类模型参数量大、训练时收敛时间长、模型泛化能力差和识别准确率低的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种基于语义分割的遥感图像地物分类方法,包括以下步骤:
S1、通过无人机采集地面物体的遥感图像,构建遥感图像集;
S2、对采集的遥感图像集进行预处理,构建样本图像数据集,并将样本图像数据集划分为训练集和验证集;
S3、构建神经网络语义分割模型;
S4、将训练集输入神经网络语义分割模型中进行训练,并采用验证集对训练过程中的参数进行调整,得到训练完成的神经网络语义分割模型;
S5、将待识别的遥感图像输入训练完成的神经网络语义分割模型中,得到地面物体分类结果,实现遥感图像的地物分类。
进一步地:步骤S2包括以下分步骤:
S21、对遥感图像集中每一张图像进行分割,得到尺寸统一的128*128的图像块;
S22、对图像块进行像素粒度的人工标注处理,得到标注图像集;
S23、对标注图像集进行扩充操作,得到样本图像数据集;
S24、将样本图像数据集划分为训练集和验证集。
进一步地:步骤S22中对图像块进行像素粒度的人工标注处理的方法为:
采用Labelme工具,对每个图像块中的植被、建筑、水体及道路进行标注命名,得到label.json文件的标注图像集。
进一步地:步骤S23中对标注图像集进行扩充操作的方法为:以水平、左右和沿对角线这三种角度对标注图像进行翻转,将翻转后的标注图像进行模糊处理、叠加噪声处理和色彩调整处理,得到样本图像数据集。
进一步地:步骤S3中神经网络语义分割模型包括:第一标准卷积层*3、第一池化层、第二标准卷积层*3、第二池化层、第三标准卷积层*3、第三池化层、第四标准卷积层*3、第四池化层、第五标准卷积层*3、第五池化层、第六标准卷积层、第七标准卷积层、第一反卷积层、第八标准卷积层*2、第二反卷积层、第九标准卷积层*2、第三反卷积层、第十标准卷积层*2、第四反卷积层、第十一标准卷积层*2、第五反卷积层、第十二标准卷积层*2和第一输出卷积层;
所述第一标准卷积层*3的输入端作为神经网络语义分割模型的输入端,其输出端分别与第一池化层的输入端、第十二标准卷积层*2的输入端和第五反卷积层的输出端连接;所述第一池化层的输出端与第二标准卷积层*3的输入端连接;所述第二标准卷积层*3的输出端分别与第二池化层的输入端、第十一标准卷积层*2的输入端和第四反卷积层的输出端连接;所述第二池化层的输出端与第三标准卷积层*3的输入端连接;所述第三标准卷积层*3的输出端分别与第三池化层的输入端、第十标准卷积层*2的输入端和第三反卷积层的输出端连接;所述第三池化层的输出端与第四标准卷积层*3的输入端连接;所述第四标准卷积层*3的输出端分别与第四池化层的输入端、第九标准卷积层*2的输入端和第二反卷积层的输出端连接;所述第四池化层的输出端与第五标准卷积层*3的输入端连接;所述第五标准卷积层*3的输出端分别与第五池化层的输入端、第八标准卷积层*2的输入端和第一反卷积层的输出端连接;所述第五池化层的输出端与第六标准卷积层的输入端连接;所述第六标准卷积层的输出端与第七标准卷积层的输入端连接;所述第七标准卷积层的输出端与第一反卷积层的输入端连接;所述第八标准卷积层*2的输出端与第二反卷积层的输入端连接;所述第九标准卷积层*2的输出端与第三反卷积层的输入端连接;所述第十标准卷积层*2的输出端与第四反卷积层的输入端连接;所述第十一标准卷积层*2的输出端与第五反卷积层的输入端连接;所述第十二标准卷积层*2的输出端与第一输出卷积层的输入端连接;所述第一输出卷积层的输出端作为神经网络语义分割模型的输出端。
进一步地:第一标准卷积层*3、第二标准卷积层*3、第三标准卷积层*3、第四标准卷积层*3和第五标准卷积层*3均为:3个依次连接的标准卷积层;
所述第六标准卷积层和第七标准卷积层均为1个标准卷积层;
所述第八标准卷积层*2、第九标准卷积层*2、第十标准卷积层*2、第十一标准卷积层*2和第十二标准卷积层*2均为:2个依次连接的标准卷积层;
所述标准卷积层均包括:依次连接的批标准化层、3*3卷积层和ELU激活函数层;
所述第一池化层、第二池化层、第三池化层、第四池化层和第五池化层均为2*2的最大池化层;
所述第一反卷积层、第二反卷积层、第三反卷积层、第四反卷积层和第五反卷积层均为2*2反卷积层;
所述第一输出卷积层为1*1卷积层。
所述3*3卷积层和1*1卷积层的过滤器尺寸均为3*3*64,单位步长,零填充,所述第一反卷积层、第二反卷积层、第三反卷积层、第四反卷积层和第五反卷积层的过滤器尺寸均为2*2*64,输出尺寸是输入尺寸的2倍,步长为2,零填充;所述第一池化层、第二池化层、第三池化层、第四池化层和第五池化层的过滤器尺寸均为2*2,步长为2。
过滤器的深度统一设置为64,使得网络结构更加清晰,并降低了时间和空间复杂度,同时由于待识别数据集中类别数和待识别特征数较少,过滤器深度不会影响模型实际预测性能。
进一步地:批标准化层的输入输出关系为:
进一步地:ELU激活函数层的ELU激活函数为:
其中,f(x)为ELU激活函数,x为ELU激活函数层的输入,α为激活参数。
上述进一步方案的有益效果为:ELU函数当输入负值时,具有软饱和性,对输入变化或噪声不敏感;当输入正值时,其导数恒为1,能够缓解网络训练过程中出现的梯度弥散现象,又ELU的输出均值接近于0,可以加速网络收敛。
进一步地:步骤S4包括以下分步骤:
S41、将训练集划分为多个批次的训练数据;
S42、将每个批次的训练数据依次输入神经网络语义分割模型中,采用交叉熵损失函数和Adam优化器对神经网络语义分割模型进行训练,并采用验证集对训练过程中的参数进行调整,得到训练完成的神经网络语义分割模型。
进一步地:步骤S4中神经网络语义分割模型进行训练过程中,参数更新公式为:
其中,θt+1为第t+1次迭代的参数,θt为第t次迭代的参数,β1为第一指数衰减率,用于控制权重分配,β2为第二指数衰减率,用来控制梯度平方的影响情况,vt-1为第t-1次迭代的梯度的二阶矩,mt-1为t-1次迭代的梯度的一阶矩,gt为第t次迭代的梯度,为常量。
上述进一步方案的有益效果为:通过参数更新公式,可以在训练神经网络时每一次迭代都会作偏置矫正,学习率在一定范围内变化,从而参数更新平稳,不容易出现梯度弥散或爆炸现象。
综上,本发明的有益效果为:一种基于语义分割的遥感图像地物分类方法中,网络在卷积操作前作批标准化处理,使用最大池化进行下采样,统一了过滤器深度(64),使用ELU替换原始ReLu激活函数来进行遥感图像的地物分类,改进模型的网络结构更加清晰,精简了模型的参数,更能在小样本的数据集上表现优异。本发明通过训练完成的神经网络语义分割模型作为遥感图像地物分类模型,提高了地物目标识别的准确率,精简了模型的参数,缓解了梯度弥散现象,模型具有更好地鲁棒性,并且减少了模型训练所需要的资源和时间。
附图说明
图1为一种基于语义分割的遥感图像地物分类方法的流程图;
图2为神经网络语义分割模型的结构示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,一种基于语义分割的遥感图像地物分类方法,包括以下步骤:
S1、通过无人机采集地面物体的遥感图像,构建遥感图像集;
S2、对采集的遥感图像集进行预处理,构建样本图像数据集,并将样本图像数据集划分为训练集和验证集;
步骤S2包括以下分步骤:
S21、对遥感图像集中每一张图像进行分割,得到尺寸统一的128*128的图像块;
S22、对图像块进行像素粒度的人工标注处理,得到标注图像集;
步骤S22中对图像块进行像素粒度的人工标注处理的方法为:
采用Labelme工具,对每个图像块中的植被、建筑、水体及道路进行标注命名,得到label.json文件的标注图像集。
S23、对标注图像集进行扩充操作,得到样本图像数据集;
步骤S23中对标注图像集进行扩充操作的方法为:以水平、左右和沿对角线这三种角度对标注图像进行翻转,将翻转后的标注图像进行模糊处理、叠加噪声处理和色彩调整处理,得到样本图像数据集。
S24、将样本图像数据集划分为训练集和验证集。
S3、构建神经网络语义分割模型;
如图2所示,步骤S3中神经网络语义分割模型包括:第一标准卷积层*3、第一池化层、第二标准卷积层*3、第二池化层、第三标准卷积层*3、第三池化层、第四标准卷积层*3、第四池化层、第五标准卷积层*3、第五池化层、第六标准卷积层、第七标准卷积层、第一反卷积层、第八标准卷积层*2、第二反卷积层、第九标准卷积层*2、第三反卷积层、第十标准卷积层*2、第四反卷积层、第十一标准卷积层*2、第五反卷积层、第十二标准卷积层*2和第一输出卷积层;
所述第一标准卷积层*3的输入端作为神经网络语义分割模型的输入端,其输出端分别与第一池化层的输入端、第十二标准卷积层*2的输入端和第五反卷积层的输出端连接;所述第一池化层的输出端与第二标准卷积层*3的输入端连接;所述第二标准卷积层*3的输出端分别与第二池化层的输入端、第十一标准卷积层*2的输入端和第四反卷积层的输出端连接;所述第二池化层的输出端与第三标准卷积层*3的输入端连接;所述第三标准卷积层*3的输出端分别与第三池化层的输入端、第十标准卷积层*2的输入端和第三反卷积层的输出端连接;所述第三池化层的输出端与第四标准卷积层*3的输入端连接;所述第四标准卷积层*3的输出端分别与第四池化层的输入端、第九标准卷积层*2的输入端和第二反卷积层的输出端连接;所述第四池化层的输出端与第五标准卷积层*3的输入端连接;所述第五标准卷积层*3的输出端分别与第五池化层的输入端、第八标准卷积层*2的输入端和第一反卷积层的输出端连接;所述第五池化层的输出端与第六标准卷积层的输入端连接;所述第六标准卷积层的输出端与第七标准卷积层的输入端连接;所述第七标准卷积层的输出端与第一反卷积层的输入端连接;所述第八标准卷积层*2的输出端与第二反卷积层的输入端连接;所述第九标准卷积层*2的输出端与第三反卷积层的输入端连接;所述第十标准卷积层*2的输出端与第四反卷积层的输入端连接;所述第十一标准卷积层*2的输出端与第五反卷积层的输入端连接;所述第十二标准卷积层*2的输出端与第一输出卷积层的输入端连接;所述第一输出卷积层的输出端作为神经网络语义分割模型的输出端。
第一标准卷积层*3、第二标准卷积层*3、第三标准卷积层*3、第四标准卷积层*3和第五标准卷积层*3均为:3个依次连接的标准卷积层;
所述第六标准卷积层和第七标准卷积层均为1个标准卷积层;
所述第八标准卷积层*2、第九标准卷积层*2、第十标准卷积层*2、第十一标准卷积层*2和第十二标准卷积层*2均为:2个依次连接的标准卷积层;
所述标准卷积层均包括:依次连接的批标准化层、3*3卷积层和ELU激活函数层;
所述第一池化层、第二池化层、第三池化层、第四池化层和第五池化层均为2*2的最大池化层;
所述第一反卷积层、第二反卷积层、第三反卷积层、第四反卷积层和第五反卷积层均为2*2反卷积层;
所述第一输出卷积层为1*1卷积层。
所述3*3卷积层和1*1卷积层的过滤器尺寸均为3*3*64,单位步长,零填充,所述第一反卷积层、第二反卷积层、第三反卷积层、第四反卷积层和第五反卷积层的过滤器尺寸均为2*2*64,输出尺寸是输入尺寸的2倍,步长为2,零填充;所述第一池化层、第二池化层、第三池化层、第四池化层和第五池化层的过滤器尺寸均为2*2,步长为2。
过滤器的深度统一设置为64,使得网络结构更加清晰,并降低了时间和空间复杂度,同时由于待识别数据集中类别数和待识别特征数较少,过滤器深度不会影响模型实际预测性能。
批标准化层的输入输出关系为:
ELU激活函数层的ELU激活函数为:
其中,f(x)为ELU激活函数,x为ELU激活函数层的输入,α为激活参数。
S4、将训练集输入神经网络语义分割模型中进行训练,并采用验证集对训练过程中的参数进行调整,得到训练完成的神经网络语义分割模型;
步骤S4包括以下分步骤:
S41、将训练集划分为多个批次的训练数据;
S42、将每个批次的训练数据依次输入神经网络语义分割模型中,采用交叉熵损失函数和Adam优化器对神经网络语义分割模型进行训练,并采用验证集对训练过程中的参数进行调整,得到训练完成的神经网络语义分割模型。
步骤S4中神经网络语义分割模型进行训练过程中,参数更新公式为:
其中,θt+1为第t+1次迭代的参数,θt为第t次迭代的参数,β1为第一指数衰减率,用于控制权重分配,β2为第二指数衰减率,用来控制梯度平方的影响情况,vt-1为第t-1次迭代的梯度的二阶矩,mt-1为t-1次迭代的梯度的一阶矩,gt为第t次迭代的梯度,为常量。
S5、将待识别的遥感图像输入训练完成的神经网络语义分割模型中,得到地面物体分类结果,实现遥感图像的地物分类。
Claims (10)
1.一种基于语义分割的遥感图像地物分类方法,其特征在于,包括以下步骤:
S1、通过无人机采集地面物体的遥感图像,构建遥感图像集;
S2、对采集的遥感图像集进行预处理,构建样本图像数据集,并将样本图像数据集划分为训练集和验证集;
S3、构建神经网络语义分割模型;
S4、将训练集输入神经网络语义分割模型中进行训练,并采用验证集对训练过程中的参数进行调整,得到训练完成的神经网络语义分割模型;
S5、将待识别的遥感图像输入训练完成的神经网络语义分割模型中,得到地面物体分类结果,实现遥感图像的地物分类。
2.根据权利要求1所述的基于语义分割的遥感图像地物分类方法,其特征在于,所述步骤S2包括以下分步骤:
S21、对遥感图像集中每一张图像进行分割,得到尺寸统一的128*128的图像块;
S22、对图像块进行像素粒度的人工标注处理,得到标注图像集;
S23、对标注图像集进行扩充操作,得到样本图像数据集;
S24、将样本图像数据集划分为训练集和验证集。
3.根据权利要求1所述的基于语义分割的遥感图像地物分类方法,其特征在于,所述步骤S22中对图像块进行像素粒度的人工标注处理的方法为:
采用Labelme工具,对每个图像块中的植被、建筑、水体及道路进行标注命名,得到label.json文件的标注图像集。
4.根据权利要求1所述的基于语义分割的遥感图像地物分类方法,其特征在于,所述步骤S23中对标注图像集进行扩充操作的方法为:以水平、左右和沿对角线这三种角度对标注图像进行翻转,将翻转后的标注图像进行模糊处理、叠加噪声处理和色彩调整处理,得到样本图像数据集。
5.根据权利要求1所述的基于语义分割的遥感图像地物分类方法,其特征在于,所述步骤S3中神经网络语义分割模型包括:第一标准卷积层*3、第一池化层、第二标准卷积层*3、第二池化层、第三标准卷积层*3、第三池化层、第四标准卷积层*3、第四池化层、第五标准卷积层*3、第五池化层、第六标准卷积层、第七标准卷积层、第一反卷积层、第八标准卷积层*2、第二反卷积层、第九标准卷积层*2、第三反卷积层、第十标准卷积层*2、第四反卷积层、第十一标准卷积层*2、第五反卷积层、第十二标准卷积层*2和第一输出卷积层;
所述第一标准卷积层*3的输入端作为神经网络语义分割模型的输入端,其输出端分别与第一池化层的输入端、第十二标准卷积层*2的输入端和第五反卷积层的输出端连接;所述第一池化层的输出端与第二标准卷积层*3的输入端连接;所述第二标准卷积层*3的输出端分别与第二池化层的输入端、第十一标准卷积层*2的输入端和第四反卷积层的输出端连接;所述第二池化层的输出端与第三标准卷积层*3的输入端连接;所述第三标准卷积层*3的输出端分别与第三池化层的输入端、第十标准卷积层*2的输入端和第三反卷积层的输出端连接;所述第三池化层的输出端与第四标准卷积层*3的输入端连接;所述第四标准卷积层*3的输出端分别与第四池化层的输入端、第九标准卷积层*2的输入端和第二反卷积层的输出端连接;所述第四池化层的输出端与第五标准卷积层*3的输入端连接;所述第五标准卷积层*3的输出端分别与第五池化层的输入端、第八标准卷积层*2的输入端和第一反卷积层的输出端连接;所述第五池化层的输出端与第六标准卷积层的输入端连接;所述第六标准卷积层的输出端与第七标准卷积层的输入端连接;所述第七标准卷积层的输出端与第一反卷积层的输入端连接;所述第八标准卷积层*2的输出端与第二反卷积层的输入端连接;所述第九标准卷积层*2的输出端与第三反卷积层的输入端连接;所述第十标准卷积层*2的输出端与第四反卷积层的输入端连接;所述第十一标准卷积层*2的输出端与第五反卷积层的输入端连接;所述第十二标准卷积层*2的输出端与第一输出卷积层的输入端连接;所述第一输出卷积层的输出端作为神经网络语义分割模型的输出端。
6.根据权利要求5所述的基于语义分割的遥感图像地物分类方法,其特征在于,所述第一标准卷积层*3、第二标准卷积层*3、第三标准卷积层*3、第四标准卷积层*3和第五标准卷积层*3均为:3个依次连接的标准卷积层;
所述第六标准卷积层和第七标准卷积层均为1个标准卷积层;
所述第八标准卷积层*2、第九标准卷积层*2、第十标准卷积层*2、第十一标准卷积层*2和第十二标准卷积层*2均为:2个依次连接的标准卷积层;所述标准卷积层均包括:依次连接的批标准化层、3*3卷积层和ELU激活函数层;
所述第一池化层、第二池化层、第三池化层、第四池化层和第五池化层均为2*2的最大池化层;所述第一反卷积层、第二反卷积层、第三反卷积层、第四反卷积层和第五反卷积层均为2*2反卷积层;
所述第一输出卷积层为1*1卷积层。
9.根据权利要求1所述的基于语义分割的遥感图像地物分类方法,其特征在于,所述步骤S4包括以下分步骤:
S41、将训练集划分为多个批次的训练数据;
S42、将每个批次的训练数据依次输入神经网络语义分割模型中,采用交叉熵损失函数和Adam优化器对神经网络语义分割模型进行训练,并采用验证集对训练过程中的参数进行调整,得到训练完成的神经网络语义分割模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011265537.2A CN112560577A (zh) | 2020-11-13 | 2020-11-13 | 一种基于语义分割的遥感图像地物分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011265537.2A CN112560577A (zh) | 2020-11-13 | 2020-11-13 | 一种基于语义分割的遥感图像地物分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112560577A true CN112560577A (zh) | 2021-03-26 |
Family
ID=75042169
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011265537.2A Pending CN112560577A (zh) | 2020-11-13 | 2020-11-13 | 一种基于语义分割的遥感图像地物分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112560577A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114494910A (zh) * | 2022-04-18 | 2022-05-13 | 陕西自然资源勘测规划设计院有限公司 | 一种基于遥感图像的设施农用地多类别识别与分类方法 |
WO2023000159A1 (zh) * | 2021-07-20 | 2023-01-26 | 海南长光卫星信息技术有限公司 | 高分辨率遥感影像半监督分类方法、装置、设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109389051A (zh) * | 2018-09-20 | 2019-02-26 | 华南农业大学 | 一种基于卷积神经网络的建筑物遥感图像识别方法 |
CN111259900A (zh) * | 2020-01-13 | 2020-06-09 | 河海大学 | 一种卫星遥感图像的语义分割方法 |
CN111640087A (zh) * | 2020-04-14 | 2020-09-08 | 中国测绘科学研究院 | 一种基于sar深度全卷积神经网络的影像变化检测方法 |
US20200320273A1 (en) * | 2017-12-26 | 2020-10-08 | Beijing Sensetime Technology Development Co., Ltd. | Remote sensing image recognition method and apparatus, storage medium and electronic device |
CN111797703A (zh) * | 2020-06-11 | 2020-10-20 | 武汉大学 | 基于鲁棒深度语义分割网络的多源遥感影像分类方法 |
-
2020
- 2020-11-13 CN CN202011265537.2A patent/CN112560577A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200320273A1 (en) * | 2017-12-26 | 2020-10-08 | Beijing Sensetime Technology Development Co., Ltd. | Remote sensing image recognition method and apparatus, storage medium and electronic device |
CN109389051A (zh) * | 2018-09-20 | 2019-02-26 | 华南农业大学 | 一种基于卷积神经网络的建筑物遥感图像识别方法 |
CN111259900A (zh) * | 2020-01-13 | 2020-06-09 | 河海大学 | 一种卫星遥感图像的语义分割方法 |
CN111640087A (zh) * | 2020-04-14 | 2020-09-08 | 中国测绘科学研究院 | 一种基于sar深度全卷积神经网络的影像变化检测方法 |
CN111797703A (zh) * | 2020-06-11 | 2020-10-20 | 武汉大学 | 基于鲁棒深度语义分割网络的多源遥感影像分类方法 |
Non-Patent Citations (1)
Title |
---|
魏芳: "基于语义分割的车载路面裂缝自动识别技术研究", 中国优秀硕士学位论文全文数据库 工程科技II辑, no. 01, pages 034 - 383 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023000159A1 (zh) * | 2021-07-20 | 2023-01-26 | 海南长光卫星信息技术有限公司 | 高分辨率遥感影像半监督分类方法、装置、设备及介质 |
CN114494910A (zh) * | 2022-04-18 | 2022-05-13 | 陕西自然资源勘测规划设计院有限公司 | 一种基于遥感图像的设施农用地多类别识别与分类方法 |
CN114494910B (zh) * | 2022-04-18 | 2022-09-06 | 陕西自然资源勘测规划设计院有限公司 | 一种基于遥感图像的设施农用地多类别识别与分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108985238B (zh) | 联合深度学习和语义概率的不透水面提取方法及系统 | |
CN111783782B (zh) | 融合改进UNet和SegNet的遥感图像语义分割方法 | |
CN111160127B (zh) | 一种基于深度卷积神经网络模型的遥感影像处理及检测方法 | |
CN112991354B (zh) | 一种基于深度学习的高分辨率遥感影像语义分割方法 | |
CN108428220B (zh) | 静止轨道卫星序列遥感影像海岛礁区域自动几何校正方法 | |
CN111259827B (zh) | 一种面向城市河道监管的水面漂浮物自动检测方法及装置 | |
CN111985274B (zh) | 一种基于卷积神经网络的遥感图像分割方法 | |
CN112347970B (zh) | 一种基于图卷积神经网络的遥感影像地物识别方法 | |
CN111079847B (zh) | 一种基于深度学习的遥感影像自动标注方法 | |
CN112560577A (zh) | 一种基于语义分割的遥感图像地物分类方法 | |
CN109241995A (zh) | 一种基于改进型ArcFace损失函数的图像识别方法 | |
CN110807485B (zh) | 基于高分遥感影像二分类语义分割图融合成多分类语义图的方法 | |
Lv et al. | Deep learning model of image classification using machine learning | |
CN112906666A (zh) | 一种农业种植结构的遥感识别方法 | |
CN111178438A (zh) | 一种基于ResNet101的天气类型识别方法 | |
CN112001293A (zh) | 结合多尺度信息和编解码网络的遥感影像地物分类方法 | |
CN111461006A (zh) | 一种基于深度迁移学习的光学遥感图像杆塔位置检测方法 | |
CN116228789A (zh) | 一种基于DeepLabv3+网络的遥感图像分割方法 | |
CN106971402B (zh) | 一种基于光学辅助的sar图像变化检测方法 | |
CN117132884A (zh) | 一种基于地块尺度的农作物遥感智能提取方法 | |
CN1472634A (zh) | 高光谱遥感图像联合加权随机分类方法 | |
Zhang et al. | Road extraction from multi-source high-resolution remote sensing image using convolutional neural network | |
CN106355196A (zh) | 基于耦合字典学习的合成孔径雷达图像目标识别方法 | |
CN113627480B (zh) | 一种基于强化学习的极化sar影像分类方法 | |
Yang et al. | Extraction of land covers from remote sensing images based on a deep learning model of NDVI-RSU-Net |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |