CN113343883A - 基于改进HRNetV2网络的港口矿堆分割方法 - Google Patents

基于改进HRNetV2网络的港口矿堆分割方法 Download PDF

Info

Publication number
CN113343883A
CN113343883A CN202110689356.0A CN202110689356A CN113343883A CN 113343883 A CN113343883 A CN 113343883A CN 202110689356 A CN202110689356 A CN 202110689356A CN 113343883 A CN113343883 A CN 113343883A
Authority
CN
China
Prior art keywords
image
hrnetv2
network
segmentation
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110689356.0A
Other languages
English (en)
Other versions
CN113343883B (zh
Inventor
陈文韬
罗霄
仪锋
韩宇
特日根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chang Guang Satellite Technology Co Ltd
Original Assignee
Chang Guang Satellite Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chang Guang Satellite Technology Co Ltd filed Critical Chang Guang Satellite Technology Co Ltd
Priority to CN202110689356.0A priority Critical patent/CN113343883B/zh
Publication of CN113343883A publication Critical patent/CN113343883A/zh
Application granted granted Critical
Publication of CN113343883B publication Critical patent/CN113343883B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

基于改进HRNetV2网络的港口矿堆分割方法,涉及光学遥感影像处理与深度学习领域,解决现有技术存在的特征融合利用不充分问题,本发明采用改进HRNetV2网络对港口矿堆光学遥感影像进行语义分割,改进HRNetV2网络可以使分割过程中不同分辨率特征图的特征有效融合,能准确地分割出港口堆矿区中的矿堆边缘。对HRNetV2网络进行改进,使用相加操作和后续的1×1卷积扩充特征图特征,使其每张低分辨率特征图特征都能融入高分辨率特征当中,增加语义分割的精度。

Description

基于改进HRNetV2网络的港口矿堆分割方法
技术领域
本发明涉及光学遥感影像处理与深度学习领域,具体涉及一种基于改进HRNetV2网络的港口矿堆分割方法。
背景技术
随着高空间分辨率光学遥感卫星技术的发展,光学遥感影像的应用被扩展到了诸多领域当中,其中光学遥感技术在金融期货领域的应用具有良好的发展前景。港口矿石堆放区是港口堆放待运输矿石的特定区域,堆矿区中一般有序堆放着各种不同矿石,这些矿石会根据不同倾倒及运输挖取方式形成矿堆。提取出遥感影像中的矿堆影像,就可以进一步估算出该港口堆放的矿石储量,矿石储量对金融期货领域的投资具有一定的指导作用。
图像语义分割是计算机视觉领域的一个重要研究方向,其目的是给图像的每一个像素标记一个分类标签,从而从像素层面将图像按类别划分,十分适用于港口矿堆遥感影像的分析研究。然而同一矿石堆放区的矿堆形状和颜色并不规则,传统的计算机视觉方法难以检测遥感影像当中的矿堆边缘。随着深度学习技术的发展,深度神经网络相比传统计算机视觉方法在图像语义分割领域有了更多进展与突破。
深度神经网络在图像语义分割方面的研究始于2015年提出的全卷积神经网络,同年Ronneberger等人提出的UNet网络采用编码器-解码器结构,将其用于医学图像的分割,由于其简单的结构和准确的分割能力,很快国内外的研究者们将其扩展到各个领域,其中遥感影像的分割研究中的建筑提取分类、变化检测、地物分类等问题都应用过UNet网络。
2015年Xuelei Li等人提出的残差网络为深度神经网络的设计提供了新思路。2018年Chaurasia等人基于残差网络提出了LinkNet分割网络,解决了降采样操作中丢失空间信息等问题。
2019年Ke Sun等人在研究人体姿态检测问题过程中提出了HRNetV1网络,随后又提出了将其扩展到图像语义分割领域的HRNetV2网络。不同于传统的串联分割网络,HRNet网络使用并行的多分辨率子网络反复交替连接交换信息进行多尺度重复融合,在网络的每一层中同时保有高分辨率与低分辨率的特征。HRNetV2网络利用HRNet输出的所有分辨率的特征图,对低分辨率特征图上采样后与高分辨率特征图进行拼接操作,再经过1*1卷积,生成分割预测图。
HRNetV2的特征主要来源于其并行特征提取部分,虽然在特征提取过程中始终保持了高分辨率与中低分辨率特征,但是最终使用了结构较为简单的特征融合结构,导致对这些特征的融合利用不够充分。
本发明使用了一种深度学习的方法对高空间分辨率光学遥感影像中的港口矿堆进行语义分割。
发明内容
本发明为解决现有技术存在的特征融合利用不充分问题,提供一种基于改进HRNetV2网络的港口矿堆分割方法。
基于改进HRNetV2网络的港口矿堆分割方法,该方法由以下步骤实现:
步骤一、获取基于高分辨率光学遥感影像的港口矿堆语义分割数据集图像;具体过程为:
步骤一一、选取不同地区矿堆影像作为港口矿堆语义分割的图像,包括不同形状、颜色、大小以及堆放方式的港口矿堆;
步骤一二、将步骤一一选取的图像采用深度学习标注工具进行人工标注,生成标签图像形式的分割标注结果;
步骤一三、将步骤一一选取的图像采用线性拉伸和单通道自动色彩增强算法进行数据集扩充,获得扩充后的图像,并同时复制步骤一二中生成的标签图像,使扩充后的图像与标签图像一一对应;
步骤一四、将步骤一三中获取的扩充后的图像与标签图像中对应标签进行切割,切割成512×512的图像,对于切割后大小不足512×512的部分,使用0值填充到512×512,将切割后的图像划分为80%的训练集和10%的验证集和10%的测试集,对于切割生成的训练集、验证集、测试集中的每一张图像,都有一张标签图像与其对应;
步骤二、对HRNetV2网络的上采样过程进行改进,具体过程为:
步骤二一、将HRNetV2网络中用于语义分割部分的连接上采样进行改进,取所有HRNetV2输出层特征图的通道数,找到最大通道数,设为c,将所有输出特征图的通道数通过1×1卷积均调整为c;
步骤二二、将所有调整后的特征图进行相加操作,然后使用1×1卷积将输出通道数调整为2c;
步骤三、采用步骤一四划分的训练集对步骤二改进的HRNetV2网络进行训练;
步骤三一、对数据集进行训练时,设定初始学习速率learning_rate=0.001,批尺寸batch_size=2,训练迭代次数epochs=100,分割类别n_classes=2;
步骤三二、训练后模型每次迭代后进行保存,并在验证集上记录交并比mIoU最高的模型参数,IoU定义如下:
Figure BDA0003125612120000031
式中,IoU为交并比mIoU的均值,Pgt为真实标签图像的像素集合,Ppred表示预测标签图像的像素集合,∩、∪、|·|分别表示交集操作、并集操作和取像素数量操作;
步骤四、采用训练后的改进HRNetV2网络对测试集数据进行图像语义分割;具体为:
步骤四一、使用步骤三二记录的模型参数对每一张测试集图像进行语义分割,获得512×512的灰度图像,灰度值范围为[0,n_classes);
步骤四二、将步骤四一中测试集图像进行分割的结果与对应真实标签图像进行对比,计算mIOU,实现港口矿堆的分割。
本发明的有益效果:
本发明采用改进HRNetV2网络对港口矿堆光学遥感影像进行语义分割,改进HRNetV2网络可以使分割过程中不同分辨率特征图的特征有效融合,能准确地分割出港口堆矿区中的矿堆边缘。
本发明所述的方法对HRNetV2网络进行改进,使用相加操作和后续的1×1卷积扩充特征图特征,使其每张低分辨率特征图特征都能融入高分辨率特征当中,增加语义分割的精度。
本发明所述的方法制作了基于吉林一号高分辨率遥感影像的港口矿堆数据集,并使用该数据集进行了语义分割训练,给计算港口矿堆储量和相关金融期货分析提供基础。
附图说明
图1为本发明所述的基于改进HRNetV2网络的港口矿堆分割方法的流程图;
图2为本发明所述的基于改进HRNetV2网络的港口矿堆分割方法中HRNetV2网络上采样结构原理图;
图3为改进HRNetV2上采样结构原理图。
具体实施方式
结合图1至图3说明本实施方式,基于改进HRNetV2网络的港口矿堆分割方法包括以下步骤:
步骤1、制作基于高分辨率光学遥感影像的港口矿堆语义分割数据集;具体过程为:
选定用作分割的矿堆数据集图像,数据集图像选用吉林一号高分辨率遥感影像,抽选4张宁波市鼠浪湖地区矿堆影像与37张澳大利亚黑德兰港地区矿堆影像制作数据集,包括了不同形状、颜色、大小、堆放方式的港口矿堆。
将选定的图像使用深度学习标注工具进行人工标注,生成标签图像形式的分割标注结果。
将41张矿堆数据集遥感影像使用线性拉伸和单通道自动色彩增强算法进行数据集扩充,扩充为82张。
将矿石堆放区图像与对应标签图像进行切割,切割成512×512大小的图像,对于切割后大小不足512×512的部分,使用0值填充到512×512,然后去除不含有效标签的图像。将切割后的686张图像划分为80%的训练集和10%的验证集和10%的测试集。对于切割生成的训练集、验证集、测试集中的每一张图像,都有一张标签图像与其对应;
步骤2、对HRNetV2网络算法进行改进:优化分割网络使用的连接上采样部分;
首先,将HRNetV2中用于语义分割部分的连接上采样(如图2所示)进行改进,取所有HRNetV2输出层特征图的通道数,另其中最大通道数为c,将所有输出特征图的通道数通过1×1卷积调整为c。
然后,将所有调整后的特征图进行相加操作,之后使用1×1卷积将输出通道数调整为2c,整个过程如图3所示。
步骤3、对矿堆分割数据集使用改进HRNetV2网络进行训练;
程序将在CPU为Intel Core i7-9700,GPU为NVIDIA GeForce RTX 2060(ComputeCapability=7.5,1920 CUDA Cores),内存为16GB,操作系统为Windows10的机器上运行,使用Python版本为3.6,torch版本为1.2.0。
对数据集进行训练时超参数如下,初始学习速率learning_rate=0.001,批尺寸batch_size=2,训练代数epochs=100,分割类别n_classes=2,包括矿堆和裸地两种分割类别,训练损失函数使用交叉熵损失函数。
训练后模型每一代保存一次,并记录在验证集上交并比(mIoU)最高的模型参数。其中mIoU是交并比(简称IoU)的均值,IoU定义如下:
Figure BDA0003125612120000051
式中Pgt表示真实标签图像的像素集合,Ppred表示预测标签图像的像素集合,∩、∪、|·|分别表示交集操作、并集操作和取像素数量操作;
步骤4、使用训练后的网络对包含矿堆的图像测试数据进行图像语义分割;
对于每一张测试集原图像使用训练后的HRNetV2网络进行语义分割测试,得到512×512大小的灰度图像,灰度值范围是[0,n_classes)。
生成的即为网络分割结果,可以将该测试集的分割结果与对应真实标签图像进行对比,计算mIOU,mIOU的数值大小即代表分割结果的准确程度。
步骤5、与UNet、LinkNet、HRNetV2等语义分割网络的分割结果进行对比。
使用Unet、LinkNet和HRNetV2替换改进HRNetV2进行步骤3和步骤4中步骤。
参见表1,将4种网络分割结果的mIOU进行比较,其中分割结果的mIOU对比如表1所示的语义分割结果对比。
表1
Figure BDA0003125612120000061
根据表1的结果,证明改进HRNetV2网络在步骤1中制作的矿堆识别遥感数据集上有更好的效果。

Claims (1)

1.基于改进HRNetV2网络的港口矿堆分割方法,其特征是:该分割方法由以下步骤实现:
步骤一、获取基于高分辨率光学遥感影像的港口矿堆语义分割数据集图像;具体过程为:
步骤一一、选取不同地区矿堆影像作为港口矿堆语义分割的图像,包括不同形状、颜色、大小以及堆放方式的港口矿堆;
步骤一二、将步骤一一选取的图像采用深度学习标注工具进行人工标注,生成标签图像形式的分割标注结果;
步骤一三、将步骤一一选取的图像采用线性拉伸和单通道自动色彩增强算法进行数据集扩充,获得扩充后的图像,并同时复制步骤一二中生成的标签图像,使扩充后的图像与标签图像一一对应;
步骤一四、将步骤一三中获取的扩充后的图像与标签图像中对应标签进行切割,切割成512×512的图像,对于切割后大小不足512×512的部分,使用0值填充到512×512,将切割后的图像划分为80%的训练集和10%的验证集和10%的测试集,对于切割生成的训练集、验证集、测试集中的每一张图像,都有一张标签图像与其对应;
步骤二、对HRNetV2网络的上采样过程进行改进,具体过程为:
步骤二一、将HRNetV2网络中用于语义分割部分的连接上采样进行改进,取所有HRNetV2输出层特征图的通道数,找到最大通道数,设为c,将所有输出特征图的通道数通过1×1卷积均调整为c;
步骤二二、将所有调整后的特征图进行相加操作,然后使用1×1卷积将输出通道数调整为2c;
步骤三、采用步骤一四划分的训练集对步骤二改进的HRNetV2网络进行训练;
步骤三一、对数据集进行训练时,设定初始学习速率learning_rate=0.001,批尺寸batch_size=2,训练迭代次数epochs=100,分割类别n_classes=2;
步骤三二、训练后模型每次迭代后进行保存,并在验证集上记录交并比mIoU最高的模型参数,IoU定义如下:
Figure FDA0003125612110000021
式中,IoU为交并比mIoU的均值,Pgt为真实标签图像的像素集合,Ppred表示预测标签图像的像素集合,∩、∪、|·|分别表示交集操作、并集操作和取像素数量操作;
步骤四、采用训练后的改进HRNetV2网络对测试集数据进行图像语义分割;具体为:
步骤四一、使用步骤三二记录的模型参数对每一张测试集图像进行语义分割,获得512×512的灰度图像,灰度值范围为[0,n_classes);
步骤四二、将步骤四一中测试集图像进行分割的结果与对应真实标签图像进行对比,计算mIOU,实现港口矿堆的分割。
CN202110689356.0A 2021-06-22 2021-06-22 基于改进HRNetV2网络的港口矿堆分割方法 Active CN113343883B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110689356.0A CN113343883B (zh) 2021-06-22 2021-06-22 基于改进HRNetV2网络的港口矿堆分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110689356.0A CN113343883B (zh) 2021-06-22 2021-06-22 基于改进HRNetV2网络的港口矿堆分割方法

Publications (2)

Publication Number Publication Date
CN113343883A true CN113343883A (zh) 2021-09-03
CN113343883B CN113343883B (zh) 2022-06-07

Family

ID=77478675

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110689356.0A Active CN113343883B (zh) 2021-06-22 2021-06-22 基于改进HRNetV2网络的港口矿堆分割方法

Country Status (1)

Country Link
CN (1) CN113343883B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113887466A (zh) * 2021-10-14 2022-01-04 广东电网有限责任公司 输电线路走廊水体隐患识别方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108765347A (zh) * 2018-05-30 2018-11-06 长光卫星技术有限公司 一种适合遥感影像的色彩增强方法
CN111127487A (zh) * 2019-12-27 2020-05-08 电子科技大学 一种实时多组织医学图像的分割方法
CN111369572A (zh) * 2020-02-28 2020-07-03 清华大学深圳国际研究生院 一种基于图像修复技术的弱监督语义分割方法和装置
CN112507777A (zh) * 2020-10-10 2021-03-16 厦门大学 一种基于深度学习的光学遥感图像舰船检测与分割方法
CN112541856A (zh) * 2020-12-07 2021-03-23 重庆邮电大学 一种结合马尔科夫场和格拉姆矩阵特征的医学类图像风格迁移方法
CN112884772A (zh) * 2019-11-29 2021-06-01 北京四维图新科技股份有限公司 语义分割架构

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108765347A (zh) * 2018-05-30 2018-11-06 长光卫星技术有限公司 一种适合遥感影像的色彩增强方法
CN112884772A (zh) * 2019-11-29 2021-06-01 北京四维图新科技股份有限公司 语义分割架构
CN111127487A (zh) * 2019-12-27 2020-05-08 电子科技大学 一种实时多组织医学图像的分割方法
CN111369572A (zh) * 2020-02-28 2020-07-03 清华大学深圳国际研究生院 一种基于图像修复技术的弱监督语义分割方法和装置
CN112507777A (zh) * 2020-10-10 2021-03-16 厦门大学 一种基于深度学习的光学遥感图像舰船检测与分割方法
CN112541856A (zh) * 2020-12-07 2021-03-23 重庆邮电大学 一种结合马尔科夫场和格拉姆矩阵特征的医学类图像风格迁移方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KE SUN ETC: ""High-resolution Representations for Labeling Pixels and Regions"", 《COMPUTOR VISION AND PATTERN RECOGNITION》 *
赵伟昱等: ""基于深度学习的遥感影像地块分割方法"", 《数据与计算发展前沿》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113887466A (zh) * 2021-10-14 2022-01-04 广东电网有限责任公司 输电线路走廊水体隐患识别方法、装置、设备及介质

Also Published As

Publication number Publication date
CN113343883B (zh) 2022-06-07

Similar Documents

Publication Publication Date Title
CN115601549B (zh) 基于可变形卷积和自注意力模型的河湖遥感图像分割方法
CN111950453A (zh) 一种基于选择性注意力机制的任意形状文本识别方法
US20230206603A1 (en) High-precision point cloud completion method based on deep learning and device thereof
CN110287806A (zh) 一种基于改进ssd网络的交通标志识别方法
CN113591795A (zh) 一种基于混合注意力特征金字塔结构的轻量化人脸检测方法和系统
CN111523439B (zh) 一种基于深度学习的目标检测的方法、系统、设备及介质
CN108230330B (zh) 一种快速的高速公路路面分割和摄像机定位的方法
CN112347970A (zh) 一种基于图卷积神经网络的遥感影像地物识别方法
CN107506765A (zh) 一种基于神经网络的车牌倾斜校正的方法
CN113256494B (zh) 一种文本图像超分辨率方法
CN114022408A (zh) 基于多尺度卷积神经网络的遥感图像云检测方法
CN112633242B (zh) 一种基于改进UNet网络的港口矿堆分割及储量计算方法
CN114724155A (zh) 基于深度卷积神经网络的场景文本检测方法、系统及设备
CN113343883B (zh) 基于改进HRNetV2网络的港口矿堆分割方法
CN113591866A (zh) 基于db与crnn的特种作业证件检测方法及系统
CN111652273A (zh) 一种基于深度学习的rgb-d图像分类方法
CN113920468A (zh) 一种基于跨尺度特征增强的多分支行人检测方法
CN113420619A (zh) 一种遥感影像建筑物提取方法
CN114283285A (zh) 交叉一致性自训练遥感图像语义分割网络训练方法及装置
CN114241469A (zh) 一种面向电表轮换过程的信息识别方法和装置
CN115410024A (zh) 一种基于动态激活热力图的电力图像缺陷检测方法
CN113313180B (zh) 一种基于深度对抗学习的遥感图像语义分割方法
CN114550189A (zh) 票据识别方法、装置、设备、计算机存储介质和程序产品
CN113688821A (zh) 一种基于深度学习的ocr文字识别方法
CN113361496A (zh) 一种基于U-Net的城市建成区统计方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: No. 1299, Mingxi Road, Beihu science and Technology Development Zone, Changchun City, Jilin Province

Applicant after: Changguang Satellite Technology Co.,Ltd.

Address before: 130032 no.1299, Mingxi Road, Beihu science and Technology Development Zone, Changchun City, Jilin Province

Applicant before: CHANG GUANG SATELLITE TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A segmentation method for port ore piles based on improved HRNetV2 network

Granted publication date: 20220607

Pledgee: Jilin Chuncheng Rural Commercial Bank Co.,Ltd.

Pledgor: Changguang Satellite Technology Co.,Ltd.

Registration number: Y2024220000054