CN113989619A - 一种基于深度学习识别模型的储罐预测方法和装置 - Google Patents

一种基于深度学习识别模型的储罐预测方法和装置 Download PDF

Info

Publication number
CN113989619A
CN113989619A CN202111305780.7A CN202111305780A CN113989619A CN 113989619 A CN113989619 A CN 113989619A CN 202111305780 A CN202111305780 A CN 202111305780A CN 113989619 A CN113989619 A CN 113989619A
Authority
CN
China
Prior art keywords
storage tank
remote sensing
sensing image
deep learning
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111305780.7A
Other languages
English (en)
Inventor
黄铜
丁亚雄
阮鲲
曹磊
丁娜娜
王绍武
李杨杨
张政
冯婉玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
3Clear Technology Co Ltd
Original Assignee
3Clear Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 3Clear Technology Co Ltd filed Critical 3Clear Technology Co Ltd
Priority to CN202111305780.7A priority Critical patent/CN113989619A/zh
Publication of CN113989619A publication Critical patent/CN113989619A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学习识别模型的储罐预测方法、装置、计算机设备和存储介质,所述方法包括:将包括待识别储罐的待识别卫星遥感影像数据输入至优化后的深度学习识别模型中进行预测,得到预测结果,预测结果包括待识别储罐的储罐位置信息、待识别储罐的轮廓信息和待识别储罐的置信度,采用本申请实施例提供的预测方法,由于优化后的深度学习识别模型为Mask RCNN识别模型,Mask R CNN识别模型在全连接层下还包括至少一个用于生成掩膜的全卷积层,掩膜用于预测出待识别储罐的轮廓信息,因此,采用该预测方法对待识别储罐进行预测,不仅能够预测出待识别储罐的储罐位置信息和待识别储罐的置信度,还能够精准地预测出待识别储罐的轮廓信息。

Description

一种基于深度学习识别模型的储罐预测方法和装置
技术领域
本发明涉及计算机技术领域,特别涉及一种基于深度学习识别模型的储罐预测方法和装置。
背景技术
储罐作为一种储存石油或者易燃易爆化学物品的工业设备,其罐体通常具有圆柱形、集群分布和群内尺寸相近等特征,多会建在城市周边甚至一些居民区周边,对其进行监测便于评估当地的油气储量,此外,如果储罐出现破损、爆炸或漏油事件将严重威胁周边市民的生命财产安全,因此,对其进行监测具有重要意义。
从生态保护红线工作来看,通过卫星或航空遥感图像实现储罐目标的快速检测,可以进一步实现对于疑似侵占生态保护红线的工业园区的快速查找,进而排查这些工业园区是否对重点生态功能区造成影响,为自然资源监管和生态环境保护提供科学技术支持。
因此,在灾害监测、环境监测、安全生产、军事等领域对储罐信息进行自动识别和预测至关重要。
传统的储罐预测方法包括模板匹配法、几何形状法、显著性检测法,此类方法受光照、成像质量以及储罐材料、结构、位置等因素影响,预测速度慢、精度低,且鲁棒性差,难以满足当今的应用需求。近年来随着深度学习算法的迅速发展,在储罐识别预测领域引入了Faster R CNN、YOLO V3、YOLO V4等算法,基于深度学习的目标检测算法显著提高了目标的识别率和速度,但只是识别出了储罐的位置,没有识别出储罐的边界范围。
在储罐目标识别预测领域,现有的储罐识别预测方法主要有以下几种:
方法1:基于Hough变换圆形检测算法:储罐罐体呈现标准的圆柱形,由于遥感卫星获取影像时存在一定角度,有时遥感图像中储罐罐体往往呈类圆形。利用储罐的圆形或者类圆形几何特征,可以有效的识别、预测储罐。
方法2:视觉显著性检测算法:将图像进行量化并进行色彩空间变换,然后用基于直方图对比度的视觉显著模型得到视觉显著图,然后用改进的多阈值OTSU算法进行分割得到显著的个体,最后用圆度、长宽比、压实率以及圆心距四个特征识别预测储罐罐体。
方法3:模板匹配法:首先提取出遥感图像的边缘特征,然后应用改进的Hough变换检测储罐边缘,最后根据同一库区的储罐尺寸比较一致的先验信息,选择一个储罐作为模板进行搜索匹配,从而实现对储罐的识别、预测。
方法4:基于深度学习的Faster R CNN算法:该模型主要由3个部分组成,包括特征提取网络、区域建议网络(RPN)和分类与回归网络。特征提取网络通过一系列的卷积与池化操作,获取特征图。RPN处理特征图得到候选框,通过ROI Pooling,将所有获取的候选框转化为固定大小特征图,最后通过分类与回归网络得到目标的类别与准确位置。实现快速且高精度的识别、预测遥感影像中的储罐。
方法5:基于深度学习的YOLOV3算法:将识别问题转换为回归问题,直接通过回归生成每个类别的边界框坐标和概率,提升了深度学习算法的识别速度,可以快速识别目标储罐。
综上所述,上述现有的储罐识别预测方法存在以下不足:
不足1:传统方法受光照、成像质量以及储罐材料、结构、位置等因素影响,识别储罐的速度慢,检测精度不高,泛化能力差,难以满足当今的应用需求。
不足2:基于深度学习的Faster R CNN、YOLO V3等算法虽然可以较好的识别出物体,但是,不能描绘出识别物体的轮廓。
发明内容
本申请实施例提供了一种基于深度学习识别模型的储罐预测方法、装置、计算机设备和存储介质。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
第一方面,本申请实施例提供了一种基于深度学习识别模型的储罐预测方法,所述方法包括:
获取用于对深度学习识别模型进行训练的数据集,所述数据集包括由训练样本数据构成的训练集、由验证样本数据构成的验证集和由测试样本数据构成的测试集;
将所述训练集中的各个数据输入至深度学习识别模型中进行训练,输出优化后的深度学习识别模型,其中,所述优化后的深度学习识别模型为Mask R CNN识别模型,所述Mask R CNN识别模型在全连接层下还包括至少一个用于生成掩膜的全卷积层,所述掩膜用于预测出待识别储罐的轮廓信息;
将包括待识别储罐的待识别卫星遥感影像数据输入至所述优化后的深度学习识别模型中进行预测,得到预测结果,所述预测结果包括待识别储罐的储罐位置信息、所述待识别储罐的轮廓信息和所述待识别储罐的置信度。
在一种实施方式中,所述方法还包括:
获取包括多个储罐的具有预设分辨率的卫星遥感影像数据集;
基于第一预设方式对所述卫星遥感影像数据集中的各个卫星遥感影像数据进行预处理,得到各个预处理后的卫星遥感影像数据。
在一种实施方式中,所述基于第一预设方式对所述卫星遥感影像数据集中的各个卫星遥感影像数据进行预处理包括:
根据预设几何校正方式,对各个卫星遥感影像数据中的任意一个卫星遥感影像数据进行几何校正处理;和/或,
根据预设辐射校正方式,对各个卫星遥感影像数据中的任意一个卫星遥感影像数据进行辐射校正处理;和/或,
基于目标地的矢量边界,对各个卫星遥感影像数据进行镶嵌和裁剪;和/或,
基于预设影像尺寸,对各个卫星遥感影像数据进行分块裁剪。
在一种实施方式中,所述方法还包括:
基于第二预设方式,将各个预处理后的卫星遥感影像数据制作成所述数据集。
在一种实施方式中,所述方法还包括:
基于预设比例分别配置对应数量的训练样本数据、验证样本数据和测试样本数据,生成对应的训练集、验证集和测试集。
在一种实施方式中,所述基于第二预设方式,将各个预处理后的卫星遥感影像数据制作成训练集包括:
对各个预处理后的卫星遥感影像数据进行标注并生成对应的包括各个标注信息的标注文件;
对各个预处理后的卫星遥感影像数据中包括的多个储罐依序进行命名;
将各个预处理后的卫星遥感影像数据对应的标注信息转换为预设标准格式;
基于所述预设比例,将标注有对应标注信息的各个预处理后的卫星遥感影像数据配置为对应的训练样本数据、验证样本数据和测试样本数据。
在一种实施方式中,所述将所述训练集中的各个数据输入至深度学习识别模型中进行训练包括:
构建基于深度学习的Mask R CNN识别模型;
初始化所述基于深度学习的Mask R CNN识别模型的模型参数,以及添加用于提升训练速度的预训练模型,所述模型参数至少包括模型的分类数、训练次数和学习率;
通过交叉熵损失函数计算损失率,通过反向传播计算多个模型参数中的任意一个参数的梯度,以及通过预设算法动态更新对应的网络参数。
第二方面,本申请实施例提供了一种基于深度学习识别模型的储罐预测装置,所述装置包括:
获取模块,用于获取用于对深度学习识别模型进行训练的数据集,所述数据集包括由训练样本数据构成的训练集、由验证样本数据构成的验证集和由测试样本数据构成的测试集;
训练模块,用于将所述获取模块获取的所述训练集中的各个数据输入至深度学习识别模型中进行训练,输出优化后的深度学习识别模型,其中,所述优化后的深度学习识别模型为Mask R CNN识别模型,所述Mask R CNN识别模型在全连接层下还包括至少一个用于生成掩膜的全卷积层,所述掩膜用于预测出待识别储罐的轮廓信息;
预测模块,用于将包括待识别储罐的待识别卫星遥感影像数据输入至所述优化后的深度学习识别模型中进行预测,得到预测结果,所述预测结果包括待识别储罐的储罐位置信息、所述待识别储罐的轮廓信息和所述待识别储罐的置信度。
第三方面,本申请实施例提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述的方法步骤。
第四方面,本申请实施例提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述的方法步骤。
本申请实施例提供的技术方案可以包括以下有益效果:
在本申请实施例中,获取用于对深度学习识别模型进行训练的数据集,所述数据集包括由训练样本数据构成的训练集、由验证样本数据构成的验证集和由测试样本数据构成的测试集;将所述训练集中的各个数据输入至深度学习识别模型中进行训练,输出优化后的深度学习识别模型,其中,所述优化后的深度学习识别模型为Mask R CNN识别模型,所述Mask R CNN识别模型在全连接层下还包括至少一个用于生成掩膜的全卷积层,所述掩膜用于预测出待识别储罐的轮廓信息;以及将包括待识别储罐的待识别卫星遥感影像数据输入至所述优化后的深度学习识别模型中进行预测,得到预测结果,所述预测结果包括待识别储罐的储罐位置信息、所述待识别储罐的轮廓信息和所述待识别储罐的置信度。采用本申请实施例提供的预测方法,由于优化后的深度学习识别模型为Mask R CNN识别模型,Mask R CNN识别模型在全连接层下还包括至少一个用于生成掩膜的全卷积层,掩膜用于预测出待识别储罐的轮廓信息,因此,采用该预测方法对待识别储罐进行预测,不仅能够预测出待识别储罐的储罐位置信息和待识别储罐的置信度,还能够精准地预测出待识别储罐的轮廓信息。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是本申请实施例提供的一种基于深度学习识别模型的储罐预测方法的流程示意图;
图2是本申请实施例具体应用场景中的数据集制作示意图;
图3是本申请实施例具体应用场景中所采用的Mask R CNN识别模型所采用的MaskR CNN整体架构图;
图4是本申请实施例具体应用场景中的基于Mask R CNN识别模型进行储罐识别所得到的储罐识别结果示意图;
图5是本申请实施例具体应用场景中的基于Faster R CNN识别模型进行储罐识别所得到的储罐识别结果示意图;
图6是本申请实施例具体应用场景中的基于深度学习识别模型的储罐预测方法的流程示意图;
图7是本申请实施例提供的一种基于深度学习识别模型的储罐预测装置的结构示意图。
具体实施方式
以下描述和附图充分地示出本发明的具体实施方案,以使本领域的技术人员能够实践它们。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
下面结合附图详细说明本公开的可选实施例。
本申请实施例提供的预测方法,通过对高分辨率遥感影像进行预处理工作(几何校正,辐射校正,裁切等),输出JPG格式数据,采用Labelme工具对数据进行标注,制作成数据集,利用Mask R CNN算法进行训练及预测,可以准确识别出储罐的位置及轮廓信息。优化后的深度学习识别模型为Mask R CNN识别模型,Mask R CNN识别模型在全连接层下还包括至少一个用于生成掩膜的全卷积层,掩膜用于预测出待识别储罐的轮廓信息。Mask R CNN算法解决了传统算法检测速度慢、检测精度差等问题,相较于Faster R CNN和YOLO等算法,它同时支持目标检测与目标分割,既可以检测出目标的位置,还可以识别出目标的轮廓信息。
请参见图1,为本申请实施例提供了基于深度学习识别模型的储罐预测方法的流程示意图。如图1所示,本申请实施例的基于深度学习识别模型的储罐预测方法可以包括以下步骤:
S102,获取用于对深度学习识别模型进行训练的数据集,数据集包括由训练样本数据构成的训练集、由验证样本数据构成的验证集和由测试样本数据构成的测试集。
在一种可能的实现方式中,本申请实施例提供的预测方法还包括以下步骤:
获取包括多个储罐的具有预设分辨率的卫星遥感影像数据集;
基于第一预设方式对卫星遥感影像数据集中的各个卫星遥感影像数据进行预处理,得到各个预处理后的卫星遥感影像数据。
在本申请实施例中,为了确保得到精准地预测结果,预设分辨率往往为高分辨率。在此对预设分辨率的具体数值不做限制,在实际应用中,卫星遥感影像数据集中的各个卫星遥感影像数据的预设分辨率越高,最终得到的预测结果也越精准。
在一种可能的实现方式中,基于第一预设方式对卫星遥感影像数据集中的各个卫星遥感影像数据进行预处理包括以下步骤:
根据预设几何校正方式,对各个卫星遥感影像数据中的任意一个卫星遥感影像数据进行几何校正处理;这样,能够有效地修正数据的几何畸变。
在一种可能的实现方式中,基于第一预设方式对卫星遥感影像数据集中的各个卫星遥感影像数据进行预处理包括以下步骤:
根据预设辐射校正方式,对各个卫星遥感影像数据中的任意一个卫星遥感影像数据进行辐射校正处理;这样,能够有效地减少大气、光照因素的影响。
在一种可能的实现方式中,基于第一预设方式对卫星遥感影像数据集中的各个卫星遥感影像数据进行预处理包括以下步骤:
基于目标地的矢量边界,对各个卫星遥感影像数据进行镶嵌和裁剪;这样,能够获取区域范围内的遥感影像数据。
在一种可能的实现方式中,基于第一预设方式对卫星遥感影像数据集中的各个卫星遥感影像数据进行预处理包括以下步骤:
基于预设影像尺寸,对各个卫星遥感影像数据进行分块裁剪;这样,能够得到若干幅分块影像。在实际应用中,为了保证后续模型训练及测试过程中GPU加速性能,将影像按照1024×1024的尺寸进行裁剪。
在一种可能的实现方式中,本申请实施例提供的预测方法还包括以下步骤:
基于第二预设方式,将各个预处理后的卫星遥感影像数据制作成数据集。
在一种可能的实现方式中,本申请实施例提供的预测方法还包括以下步骤:
基于预设比例分别配置对应数量的训练样本数据、验证样本数据和测试样本数据,生成对应的训练集、验证集和测试集。
在一种可能的实现方式中,基于第二预设方式,将各个预处理后的卫星遥感影像数据制作成训练集包括以下步骤:
对各个预处理后的卫星遥感影像数据进行标注并生成对应的包括各个标注信息的标注文件;
对各个预处理后的卫星遥感影像数据中包括的多个储罐依序进行命名;
将各个预处理后的卫星遥感影像数据对应的标注信息转换为预设标准格式;
基于预设比例,将标注有对应标注信息的各个预处理后的卫星遥感影像数据配置为对应的训练样本数据、验证样本数据和测试样本数据。
在本申请实施例中,对预设比例不做具体限制,可以根据不同应用场景的需求,对该预设比例进行调整。
如图2所示,是本申请实施例具体应用场景中的数据集制作示意图。如图2所示,为labelme数据标注软件,通过此软件打开一张带有储罐的图片,点击Create Polygons,即可在图片上进行标注,用鼠标右键点击储罐的轮廓,按照储罐的轮廓进行描绘,即可勾勒出储罐的轮廓,以此作为训练数据集。
在某一具体应用场景下,将各个预处理后的卫星遥感影像数据制作成训练集包括以下步骤,具体如下所述:
步骤a1:使用Labelme工具对各个预处理后的卫星遥感影像数据进行标注,得到对应的标注信息文件,如图2所示;
步骤a2:对影像中多个储罐按照顺序进行命名,如:oiltank1、oiltank2、oiltank3……;
步骤a3:将对应的标注文件信息转换为标准的MS COCO格式;
步骤a4:对标注完的数据按照6:2:2的比例划分为训练样本、验证样本、测试样本。
S104,将训练集中的各个数据输入至深度学习识别模型中进行训练,输出优化后的深度学习识别模型,其中,优化后的深度学习识别模型为Mask R CNN识别模型,Mask RCNN识别模型在全连接层下还包括至少一个用于生成掩膜的全卷积层,掩膜用于预测出待识别储罐的轮廓信息。
在一种可能的实现方式中,将训练集中的各个数据输入至深度学习识别模型中进行训练包括以下步骤:
步骤b1:构建基于深度学习的Mask R CNN识别模型;
步骤b2:初始化基于深度学习的Mask R CNN识别模型的模型参数,以及添加用于提升训练速度的预训练模型,模型参数至少包括模型的分类数、训练次数和学习率;
步骤b3:通过交叉熵损失函数计算损失率,通过反向传播计算多个模型参数中的任意一个参数的梯度,以及通过预设算法动态更新对应的网络参数。
针对上述步骤分别进行详细描述,具体如下所述:
步骤b1:构建基于深度学习的Mask R CNN识别模型,具体结构如图3所示。
采用ResNet101作为基础网络架构,与特征金字塔网络(FPN)结合,用于提取多层次网络特征。此部分对输入进来的图像尺寸有要求,需要可以整除2的6次方,在对遥感影像进行分块裁剪的过程中,已将图像按要求裁剪好。ResNet分为5个层,最终得到5个层次的特征图,分别为:C1、C2、C3、C4、C5。融合C2、C3、C4、C5建立特征金字塔,得到新的特征图:P2、P3、P4、P5、P6。
上述过程具体如下所述:
ResNet网络作为backbone主要用来提取图像的特征,Mask R CNN模型对输入图像的大小没要求,但我们可以通过IMAGE_MIN_DIM和IMAGE_MAX_DIM两个参数进行设置,统一输入图像的大小,例如,将图像设置为1024×1024的尺寸。
首先,将图像输入进ResNet网络进行5次卷积和池化特征提取操作,输出5个stage,记为C1、C2、C3、C4、C5,其中C1的尺寸为256×256×64,C2的尺寸为256×256×256,C3的尺寸为128×128×512,C4的尺寸为64×64×1024,C5的尺寸为32×32×2048。
然后,利用C2、C3、C4、C5建立特征图金字塔结构:对P5进行最大池化,步长为2,得到16×16×256的特征图,记为P6;将C5进行卷积操作,卷积核大小为1×1×256,得到32×32×256的特征图,记为P5;将P5进行上采样,步长为2,得到的结果与C4进行卷积的结果相加,卷积核大小为1×1×256,得到64×64×256的特征图,记为P4;将P4进行上采样,步长为2,得到的结果与C3进行卷积的结果相加,卷积核大小为1×1×256,得到128×128×256的特征图,记为P3;将P3进行上采样,步长为2,得到的结果与C2进行卷积的结果相加,卷积核大小为1×1×256,得到256×256×256的特征图,记为P2;以上就是有效特征层的构造步骤。
提取到的P2、P3、P4、P5、P6作为RPN网络的有效特征层,利用RPN建议框网络对先验框进行解码,得到建议框。
上述过程具体如下所述:
在RPN网络中遍历P2、P3、P4、P5、P6这5个特征层,以每个特征图上的每个像素点生成锚框,锚框采样的步长设置为1,生成锚框时的长宽比例(0.5,1,2),网络的通道数设置为256,最终保留的ROIs的数量取2000,锚框与真实框的交并比设置为0.7。通过配置参数对不同尺寸的特征层进行锚框采集,每种特征层对应一种锚框,每个锚框都有三种长宽比,每个像素点生成三个锚框。
使用IoU(锚框与真实框的交并比)标记出锚框的正负样本,大于0.7的标记为正样本,小于0.3的标记为负样本,介于0.3和0.7之间的为不明确样本,在模型训练时丢弃不用。针对正样本,结合真实框的中心点和宽高进行回归运算,得到锚框的修正信息。此步骤需要计算以下四个变量:
dx=(x-x’)/w’;
dy=(y-y’)/h’;
dw=log((w-w’)/w’);
dh=log((h-h’)/h’);
其中,x、y、w、h为真实框的中心点坐标和宽高,x’、y’、w’、h’为锚框的中心点坐标和宽高,对以上四个变量进行回归训练,得出锚框的修正信息。
选择正样本得分较高的锚框,通过修正信息得到修正后的锚框,再对修正后的锚框进行非极大值抑制处理,去掉重复值,得到最终的感兴趣区,即有可能框柱物体的区域。
非极大值抑制的做法是:样本按照得分进行排序,选出最高得分的锚框,遍历其余的锚框,如果和最高得分的锚框的重叠面积(IOU)大于阈值(设置为0.5),就将其删除,依次重复这一操作,得到最终去除重复值的区域,即建议框。
使用Mask R CNN模型中的ROIAlign方法,根据预选框的位置坐标在特征图中将相应区域池化为固定尺寸的特征图,以便进行后续的分类和锚框回归操作。由此,网络分为三个部分:全连接预测类别class、全连接预测矩形框box、全卷积预测像素分割mask。
步骤b2:初始化基于深度学习的Mask R CNN识别模型的模型参数,以及添加用于提升训练速度的预训练模型,模型参数至少包括模型的分类数、训练次数和学习率;上述过程具体如下所述:
由于本申请实施例提供的预测方法,仅用于预测及识别一种物体,即:储罐,因此,设置模型的分类数为2(1个类别+背景类);训练次数设置为100,即epoch=100;学习率设置为0.00005,即learning_rate=1e-5。Mask R CNN模型在COCO数据集上的预训练权重为mask_rcnn_coco.h5,本申请实施例提供的预测方法,在训练时使用这一文件,设置如下:COCO_MODEL_PATH=“model_data/mask_rcnn_coco.h5”,通过加载预训练模型,能够使模型参数分布在一个性能强的范围之内,缓解过拟合,能够加快模型的收敛速度。该预训练权重中包含有训练好的分类回归参数,在此基础上结合自己的数据集能减少重复训练的时间,从而提高速度。
步骤b3:通过交叉熵损失函数计算损失率,通过反向传播计算多个模型参数中的任意一个参数的梯度,以及通过预设算法动态更新对应的网络参数。上述过程具体如下所述:
通过交叉熵损失函数计算损失率,通过反向传播计算多个模型参数中的任意一个参数的梯度,以及通过预设算法动态更新对应的网络参数。
在本申请实施例中,预设算法可以采用Adam算法动态更新网络参数。
交叉熵损失函数常用于分类问题中,用来判定实际的输出与期望的输出的接近程度,形式如下:
Figure BDA0003340056240000121
其中,yi为实际概率,Si为计算得出的预测概率值。
Adam优化算法是一种对随机梯度下降法的扩展,设置如下:
#调用SGD优化函数
optimizer=keras.optimizers.Adam(lr=learning_rate)。
SS106,将包括待识别储罐的待识别卫星遥感影像数据输入至优化后的深度学习识别模型中进行预测,得到预测结果,预测结果包括待识别储罐的储罐位置信息、待识别储罐的轮廓信息和待识别储罐的置信度。
在本申请实施例中,将包括待识别储罐的待识别卫星遥感影像数据输入至优化后的深度学习识别模型中进行预测的过程,与训练类似,在预测过程中也需要对待识别储罐的待识别卫星遥感影像数据进行上述类似的预处理过程,得到对应的预处理后的卫星遥感影像数据,具体预处理过程参见前述,在此不再赘述。然后,将预处理后的卫星遥感影像数据输入至优化后的深度学习识别模型中,得到预测结果。如图4所示,预测结果包括每一个储罐的位置边框、每一个储罐的轮廓以及每一个储罐的置信度。如图4所示,图4中圆形物体为储罐,方框为框选出的储罐位置,圆形框及圆形框内部的灰色填充描绘的是储罐的轮廓,上方的文字,oiltank/storage tank为储罐的英文名,数字为置信度。
相对于现有技术,如图5所示,例如,基于Faster R CNN模型进行储罐预测所得到的预测结果只有储罐的卫星边框和置信度,无法预测出储罐的轮廓。
Mask R-CNN是在Faster R-CNN上进行扩展,即:在其已有的用于边界框识别的分支上添加了一个并行的、且用于预测目标掩膜的分支。如图3所示,在全连接层下多出一个全卷积层用于生成掩膜,从而基于该掩膜可以识别出储罐的轮廓,并生成对应储罐的轮廓信息。
如图6所示,是本申请实施例具体应用场景中的基于深度学习识别模型的储罐预测方法的流程示意图。
基于如图6所示的各个步骤与前述步骤相同或相似,在此不再赘述,参见前述。
本申请实施例提供的预测方法,通过制作涵盖多场景、各类型储罐形状和纹理信息,并在模型训练中使用GPU进行加速,因此,最终得到的优化后的深度学习识别模型可以准确、高效的提取出高分辨率遥感影像中的储罐信息,针对影像中储罐显示不全,或者由于裁剪问题导致的储罐被分为多个部分,本申请实施例提供的预测方法依然能够有效识别;从而提高了储罐识别的自动化程度、精准度和时效性。
此外,本申请实施例提供的预测方法,对待识别储罐的识别精准度高,而且处理流程较为简单。
在本申请实施例中,获取用于对深度学习识别模型进行训练的数据集,数据集包括由训练样本数据构成的训练集、由验证样本数据构成的验证集和由测试样本数据构成的测试集;将训练集中的各个数据输入至深度学习识别模型中进行训练,输出优化后的深度学习识别模型,其中,优化后的深度学习识别模型为Mask R CNN识别模型,Mask R CNN识别模型在全连接层下还包括至少一个用于生成掩膜的全卷积层,掩膜用于预测出待识别储罐的轮廓信息;以及将包括待识别储罐的待识别卫星遥感影像数据输入至优化后的深度学习识别模型中进行预测,得到预测结果,预测结果包括待识别储罐的储罐位置信息、待识别储罐的轮廓信息和待识别储罐的置信度。采用本申请实施例提供的预测方法,由于优化后的深度学习识别模型为Mask R CNN识别模型,Mask R CNN识别模型在全连接层下还包括至少一个用于生成掩膜的全卷积层,掩膜用于预测出待识别储罐的轮廓信息,因此,采用该预测方法对待识别储罐进行预测,不仅能够预测出待识别储罐的储罐位置信息和待识别储罐的置信度,还能够精准地预测出待识别储罐的轮廓信息。
下述为本发明基于深度学习识别模型的储罐预测装置实施例,可以用于执行本发明基于深度学习识别模型的储罐预测方法实施例。对于本发明基于深度学习识别模型的储罐预测装置实施例中未披露的细节,请参照本发明基于深度学习识别模型的储罐预测方法实施例。
请参见图7,其示出了本发明一个示例性实施例提供的基于深度学习识别模型的储罐预测装置的结构示意图。该基于深度学习识别模型的储罐预测装置可以通过软件、硬件或者两者的结合实现成为终端的全部或一部分。该基于深度学习识别模型的储罐预测装置包括获取模块10、训练模块20和预测模块30。
具体而言,获取模块10,用于获取用于对深度学习识别模型进行训练的数据集,数据集包括由训练样本数据构成的训练集、由验证样本数据构成的验证集和由测试样本数据构成的测试集;
训练模块20,用于将获取模块10获取的训练集中的各个数据输入至深度学习识别模型中进行训练,输出优化后的深度学习识别模型,其中,优化后的深度学习识别模型为Mask R CNN识别模型,Mask R CNN识别模型在全连接层下还包括至少一个用于生成掩膜的全卷积层,掩膜用于预测出待识别储罐的轮廓信息;
预测模块30,用于将包括待识别储罐的待识别卫星遥感影像数据输入至优化后的深度学习识别模型中进行预测,得到预测结果,预测结果包括待识别储罐的储罐位置信息、待识别储罐的轮廓信息和待识别储罐的置信度。
可选的,获取模块10还用于:
获取包括多个储罐的具有预设分辨率的卫星遥感影像数据集;
可选的,所述装置还包括:
预处理模块(在图7未示出),用于基于第一预设方式对获取模块10获取的卫星遥感影像数据集中的各个卫星遥感影像数据进行预处理,得到各个预处理后的卫星遥感影像数据。
可选的,预处理模块具体用于:
根据预设几何校正方式,对各个卫星遥感影像数据中的任意一个卫星遥感影像数据进行几何校正处理;和/或,
根据预设辐射校正方式,对各个卫星遥感影像数据中的任意一个卫星遥感影像数据进行辐射校正处理;和/或,
基于目标地的矢量边界,对各个卫星遥感影像数据进行镶嵌和裁剪;和/或,
基于预设影像尺寸,对各个卫星遥感影像数据进行分块裁剪。
可选的,所述装置还包括:
数据集制作模块(在图7中未示出),用于基于第二预设方式,将预处理模块得到的各个预处理后的卫星遥感影像数据制作成数据集。
可选的,所述装置还包括:
配置模块(在图7中未示出),用于基于预设比例分别配置对应数量的训练样本数据、验证样本数据和测试样本数据,生成对应的训练集、验证集和测试集。
可选的,数据集制作模块具体用于:
对各个预处理后的卫星遥感影像数据进行标注并生成对应的包括各个标注信息的标注文件;
对各个预处理后的卫星遥感影像数据中包括的多个储罐依序进行命名;
将各个预处理后的卫星遥感影像数据对应的标注信息转换为预设标准格式;
基于预设比例,将标注有对应标注信息的各个预处理后的卫星遥感影像数据配置为对应的训练样本数据、验证样本数据和测试样本数据。
可选的,训练模块20具体用于:
构建基于深度学习的Mask R CNN识别模型;
初始化基于深度学习的Mask R CNN识别模型的模型参数,以及添加用于提升训练速度的预训练模型,模型参数至少包括模型的分类数、训练次数和学习率;
通过交叉熵损失函数计算损失率,通过反向传播计算多个模型参数中的任意一个参数的梯度,以及通过预设算法动态更新对应的网络参数。
需要说明的是,上述实施例提供的基于深度学习识别模型的储罐预测装置在执行基于深度学习识别模型的储罐预测方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的基于深度学习识别模型的储罐预测装置与基于深度学习识别模型的储罐预测方法实施例属于同一构思,其体现实现过程详见基于深度学习识别模型的储罐预测方法实施例,这里不再赘述。
在本申请实施例中,获取模块用于获取用于对深度学习识别模型进行训练的数据集,数据集包括由训练样本数据构成的训练集、由验证样本数据构成的验证集和由测试样本数据构成的测试集;训练模块用于将获取模块获取的训练集中的各个数据输入至深度学习识别模型中进行训练,输出优化后的深度学习识别模型,其中,优化后的深度学习识别模型为Mask R CNN识别模型,Mask R CNN识别模型在全连接层下还包括至少一个用于生成掩膜的全卷积层,掩膜用于预测出待识别储罐的轮廓信息;以及预测模块用于将包括待识别储罐的待识别卫星遥感影像数据输入至优化后的深度学习识别模型中进行预测,得到预测结果,预测结果包括待识别储罐的储罐位置信息、待识别储罐的轮廓信息和待识别储罐的置信度。采用本申请实施例,。
在一个实施例中,提出了一种计算机设备,计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:获取用于对深度学习识别模型进行训练的数据集,数据集包括由训练样本数据构成的训练集、由验证样本数据构成的验证集和由测试样本数据构成的测试集;将训练集中的各个数据输入至深度学习识别模型中进行训练,输出优化后的深度学习识别模型,其中,优化后的深度学习识别模型为Mask R CNN识别模型,Mask R CNN识别模型在全连接层下还包括至少一个用于生成掩膜的全卷积层,掩膜用于预测出待识别储罐的轮廓信息;以及将包括待识别储罐的待识别卫星遥感影像数据输入至优化后的深度学习识别模型中进行预测,得到预测结果,预测结果包括待识别储罐的储罐位置信息、待识别储罐的轮廓信息和待识别储罐的置信度。
在一个实施例中,提出了一种存储有计算机可读指令的存储介质,该计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行以下步骤:获取用于对深度学习识别模型进行训练的数据集,数据集包括由训练样本数据构成的训练集、由验证样本数据构成的验证集和由测试样本数据构成的测试集;将训练集中的各个数据输入至深度学习识别模型中进行训练,输出优化后的深度学习识别模型,其中,优化后的深度学习识别模型为Mask R CNN识别模型,Mask R CNN识别模型在全连接层下还包括至少一个用于生成掩膜的全卷积层,掩膜用于预测出待识别储罐的轮廓信息;以及将包括待识别储罐的待识别卫星遥感影像数据输入至优化后的深度学习识别模型中进行预测,得到预测结果,预测结果包括待识别储罐的储罐位置信息、待识别储罐的轮廓信息和待识别储罐的置信度。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于深度学习识别模型的储罐预测方法,其特征在于,所述方法包括:
获取用于对深度学习识别模型进行训练的数据集,所述数据集包括由训练样本数据构成的训练集、由验证样本数据构成的验证集和由测试样本数据构成的测试集;
将所述训练集中的各个数据输入至深度学习识别模型中进行训练,输出优化后的深度学习识别模型,其中,所述优化后的深度学习识别模型为Mask RCNN识别模型,所述Mask RCNN识别模型在全连接层下还包括至少一个用于生成掩膜的全卷积层,所述掩膜用于预测出待识别储罐的轮廓信息;
将包括待识别储罐的待识别卫星遥感影像数据输入至所述优化后的深度学习识别模型中进行预测,得到预测结果,所述预测结果包括待识别储罐的储罐位置信息、所述待识别储罐的轮廓信息和所述待识别储罐的置信度。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取包括多个储罐的具有预设分辨率的卫星遥感影像数据集;
基于第一预设方式对所述卫星遥感影像数据集中的各个卫星遥感影像数据进行预处理,得到各个预处理后的卫星遥感影像数据。
3.根据权利要求2所述的方法,其特征在于,所述基于第一预设方式对所述卫星遥感影像数据集中的各个卫星遥感影像数据进行预处理包括:
根据预设几何校正方式,对各个卫星遥感影像数据中的任意一个卫星遥感影像数据进行几何校正处理;和/或,
根据预设辐射校正方式,对各个卫星遥感影像数据中的任意一个卫星遥感影像数据进行辐射校正处理;和/或,
基于目标地的矢量边界,对各个卫星遥感影像数据进行镶嵌和裁剪;和/或,
基于预设影像尺寸,对各个卫星遥感影像数据进行分块裁剪。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
基于第二预设方式,将各个预处理后的卫星遥感影像数据制作成所述数据集。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
基于预设比例分别配置对应数量的训练样本数据、验证样本数据和测试样本数据,生成对应的训练集、验证集和测试集。
6.根据权利要求5所述的方法,其特征在于,所述基于第二预设方式,将各个预处理后的卫星遥感影像数据制作成训练集包括:
对各个预处理后的卫星遥感影像数据进行标注并生成对应的包括各个标注信息的标注文件;
对各个预处理后的卫星遥感影像数据中包括的多个储罐依序进行命名;
将各个预处理后的卫星遥感影像数据对应的标注信息转换为预设标准格式;
基于所述预设比例,将标注有对应标注信息的各个预处理后的卫星遥感影像数据配置为对应的训练样本数据、验证样本数据和测试样本数据。
7.根据权利要求1所述的方法,其特征在于,所述将所述训练集中的各个数据输入至深度学习识别模型中进行训练包括:
构建基于深度学习的Mask R CNN识别模型;
初始化所述基于深度学习的Mask R CNN识别模型的模型参数,以及添加用于提升训练速度的预训练模型,所述模型参数至少包括模型的分类数、训练次数和学习率;
通过交叉熵损失函数计算损失率,通过反向传播计算多个模型参数中的任意一个参数的梯度,以及通过预设算法动态更新对应的网络参数。
8.一种基于深度学习识别模型的储罐预测装置,其特征在于,所述装置包括:
获取模块,用于获取用于对深度学习识别模型进行训练的数据集,所述数据集包括由训练样本数据构成的训练集、由验证样本数据构成的验证集和由测试样本数据构成的测试集;
训练模块,用于将所述获取模块获取的所述训练集中的各个数据输入至深度学习识别模型中进行训练,输出优化后的深度学习识别模型,其中,所述优化后的深度学习识别模型为Mask R CNN识别模型,所述Mask R CNN识别模型在全连接层下还包括至少一个用于生成掩膜的全卷积层,所述掩膜用于预测出待识别储罐的轮廓信息;
预测模块,用于将包括待识别储罐的待识别卫星遥感影像数据输入至所述优化后的深度学习识别模型中进行预测,得到预测结果,所述预测结果包括待识别储罐的储罐位置信息、所述待识别储罐的轮廓信息和所述待识别储罐的置信度。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项权利要求所述预测方法的步骤。
10.一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项权利要求所述预测方法的步骤。
CN202111305780.7A 2021-11-05 2021-11-05 一种基于深度学习识别模型的储罐预测方法和装置 Pending CN113989619A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111305780.7A CN113989619A (zh) 2021-11-05 2021-11-05 一种基于深度学习识别模型的储罐预测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111305780.7A CN113989619A (zh) 2021-11-05 2021-11-05 一种基于深度学习识别模型的储罐预测方法和装置

Publications (1)

Publication Number Publication Date
CN113989619A true CN113989619A (zh) 2022-01-28

Family

ID=79746776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111305780.7A Pending CN113989619A (zh) 2021-11-05 2021-11-05 一种基于深度学习识别模型的储罐预测方法和装置

Country Status (1)

Country Link
CN (1) CN113989619A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118152884A (zh) * 2024-03-21 2024-06-07 北京溥络数智科技有限责任公司 化工罐量预测方法、装置和化工罐实时监测系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110490860A (zh) * 2019-08-21 2019-11-22 北京大恒普信医疗技术有限公司 糖尿病视网膜病变识别方法、装置及电子设备
CN111598951A (zh) * 2020-05-18 2020-08-28 清华大学 一种识别空间目标的方法、装置和存储介质
CN112101138A (zh) * 2020-08-26 2020-12-18 东南大学 基于深度学习的桥梁拉索表面缺陷实时识别系统及方法
CN112749673A (zh) * 2021-01-20 2021-05-04 西安中科星图空间数据技术有限公司 一种基于遥感影像智能提取储油罐库存的方法及装置
CN112766274A (zh) * 2021-02-01 2021-05-07 长沙市盛唐科技有限公司 一种基于Mask RCNN算法的水尺图像水位自动读数方法及系统
CN113255607A (zh) * 2021-06-30 2021-08-13 北京道达天际科技有限公司 基于多模型融合的遥感房屋检测方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110490860A (zh) * 2019-08-21 2019-11-22 北京大恒普信医疗技术有限公司 糖尿病视网膜病变识别方法、装置及电子设备
CN111598951A (zh) * 2020-05-18 2020-08-28 清华大学 一种识别空间目标的方法、装置和存储介质
CN112101138A (zh) * 2020-08-26 2020-12-18 东南大学 基于深度学习的桥梁拉索表面缺陷实时识别系统及方法
CN112749673A (zh) * 2021-01-20 2021-05-04 西安中科星图空间数据技术有限公司 一种基于遥感影像智能提取储油罐库存的方法及装置
CN112766274A (zh) * 2021-02-01 2021-05-07 长沙市盛唐科技有限公司 一种基于Mask RCNN算法的水尺图像水位自动读数方法及系统
CN113255607A (zh) * 2021-06-30 2021-08-13 北京道达天际科技有限公司 基于多模型融合的遥感房屋检测方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赫晓慧 等: "《遥感基础导论》", 31 May 2016 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118152884A (zh) * 2024-03-21 2024-06-07 北京溥络数智科技有限责任公司 化工罐量预测方法、装置和化工罐实时监测系统

Similar Documents

Publication Publication Date Title
Xie et al. Multilevel cloud detection in remote sensing images based on deep learning
CN110717489B (zh) Osd的文字区域的识别方法、装置及存储介质
CN106778835B (zh) 融合场景信息和深度特征的遥感图像机场目标识别方法
CN110232713B (zh) 一种图像目标定位修正方法及相关设备
CN113033520B (zh) 一种基于深度学习的树木线虫病害木识别方法及系统
CN109343920B (zh) 一种图像处理方法及其装置、设备和存储介质
CN111985376A (zh) 一种基于深度学习的遥感影像舰船轮廓提取方法
CN111931581A (zh) 一种基于卷积神经网络农业害虫识别方法、终端及可读存储介质
CN115546116B (zh) 全覆盖式岩体不连续面提取与间距计算方法及系统
CN111539456B (zh) 一种目标识别方法及设备
CN110852327A (zh) 图像处理方法、装置、电子设备及存储介质
CN113537070A (zh) 一种检测方法、装置、电子设备及存储介质
CN115953612A (zh) 一种基于ConvNeXt的遥感影像植被分类方法和装置
CN116740758A (zh) 一种防止误判的鸟类图像识别方法及系统
CN109255792A (zh) 一种视频图像的分割方法、装置、终端设备及存储介质
CN116824466A (zh) 辅助少儿智能编程的方法、装置和计算机存储介质
CN114972947A (zh) 一种基于模糊语义建模的深度场景文本检测方法和装置
CN113989619A (zh) 一种基于深度学习识别模型的储罐预测方法和装置
CN111797940A (zh) 一种基于海洋搜救的图像识别方法及相关装置
CN116824330A (zh) 一种基于深度学习的小样本跨域目标检测方法
CN115984712A (zh) 基于多尺度特征的遥感图像小目标检测方法及系统
CN110889418A (zh) 一种气体轮廓识别方法
CN113343987B (zh) 文本检测处理方法、装置、电子设备及存储介质
CN116091784A (zh) 一种目标跟踪方法、设备及存储介质
CN115345895A (zh) 用于视觉检测的图像分割方法、装置、计算机设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220128