CN114882375A - 一种尾矿库智能识别方法和装置 - Google Patents
一种尾矿库智能识别方法和装置 Download PDFInfo
- Publication number
- CN114882375A CN114882375A CN202210455836.5A CN202210455836A CN114882375A CN 114882375 A CN114882375 A CN 114882375A CN 202210455836 A CN202210455836 A CN 202210455836A CN 114882375 A CN114882375 A CN 114882375A
- Authority
- CN
- China
- Prior art keywords
- remote sensing
- tailing pond
- sensing image
- identification
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/52—Scale-space analysis, e.g. wavelet analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/06—Recognition of objects for industrial automation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Astronomy & Astrophysics (AREA)
- Remote Sensing (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种尾矿库智能识别方法和装置。其中,该方法包括:对获取到的遥感图像进行预处理,以得到预处理后的遥感图像;对所述预处理后的遥感图像进行图像增强操作,以得到增强后的遥感图像;基于深度学习目标检测模型对所述增强后的遥感图像进行训练,以得到训练后的尾矿库识别模型;将待识别的目标尾矿库图像输入所述尾矿库识别模型,以得到所述尾矿库识别模型输出的目标尾矿库的识别结果。本发明通过将目标检测网络RetinaNet引入遥感影像尾矿库识别任务,通过深度残差网络框架ResNet101以及特征金字塔结构提取并融合图像中的浅层纹理信息及深层语义信息,通过焦点损失目标函数调节正负样本的损失权重,实现了遥感影像中尾矿库的精确定位。
Description
技术领域
本发明实施例涉及环境大数据技术领域,尤其涉及一种尾矿库智能识别方法和装置。
背景技术
尾矿库是指筑坝拦截谷口或围地构成的,用以堆存金属或非金属矿山进行矿石选别后排出尾矿或其他工业废渣的场所。尾矿库是一个具有高势能的人造泥石流危险源,存在溃坝危险,一旦失事,容易造成重特大事故。因此,对尾矿库的调查识别显得尤为重要。
现有技术中的尾矿库调查主要以地面调查为主,难以对大范围地区实现高频率的尾矿调查;此外,各种尾矿库数量庞大、种类繁多、形状特征差异大,传统的手工特征图像处理方法难以完成精确的自动化尾矿识别,并且传统的尾矿库智能识别方法对小面积尾矿的识别精度仍存在一定的改进空间。
发明内容
为了解决现有技术中的问题,本发明提供一种尾矿库智能识别方法和装置,以实现对遥感影像中尾矿库的精确定位。
第一方面,本发明实施例提供了一种尾矿库智能识别方法,包括:
S110、对获取到的遥感图像进行预处理,以得到预处理后的遥感图像;
S120、对所述预处理后的遥感图像进行图像增强操作,以得到增强后的遥感图像;
S130、基于深度学习目标检测模型对所述增强后的遥感图像进行训练,以得到训练后的尾矿库识别模型;
S140、将待识别的目标尾矿库图像输入所述尾矿库识别模型,以得到所述尾矿库识别模型输出的目标尾矿库的识别结果。
可选的,所述深度学习目标检测模型包括深度残差网络框架ResNet框架和特征金字塔结构。
可选的,采用焦点损失函数作为所述深度学习目标检测模型训练过程中的目标函数。
可选的,所述S140中所述尾矿库识别模型输出目标尾矿库的识别结果,包括:
通过非最大值抑制的方式对所述尾矿库识别模型输出的所有识别结果进行筛选,以得到筛选后的识别结果;
通过遥感影像的地理信息计算所述筛选后的识别结果的精确经纬度信息,输出目标尾矿库的地理位置及其附近的遥感影像信息。
第二方面,本发明实施例还提供了一种尾矿库智能识别装置,包括:
预处理模块,用于对获取到的遥感图像进行预处理,以得到预处理后的遥感图像;
图像增强模块,用于对所述预处理后的遥感图像进行图像增强操作,以得到增强后的遥感图像;
模型训练模块,用于基于深度学习目标检测模型对所述增强后的遥感图像进行训练,以得到训练后的尾矿库识别模型;
识别模块,用于将待识别的目标尾矿库图像输入所述尾矿库识别模型,以得到所述尾矿库识别模型输出的目标尾矿库的识别结果。
本发明的有益效果:
本发明在现有图像识别技术的基础上,构建基于深度学习尾矿库智能识别模型,通过在大规模遥感影像中进行扫描,实现自动化尾矿库识别;本发明采用密集采样检测器(RetinaNet)结构,基于深度残差神经网络(ResNet101)框架搭建单阶段的密集采样检测模型,结合特征金字塔(Feature Pyramid Network, FPN)处理多尺度的尾矿特征表示,并采用焦点损失(Focal Loss)函数作为目标函数来评价训练过程中模型的性能,综合考虑各类样本的学习误差,缓解数据集中正负样本分布不均衡带来的训练效率下降问题,以实现对遥感影像中尾矿库的精确定位。
附图说明
图1为本发明实施例提供的一种尾矿库智能识别方法的流程图;
图2为本发明实施例提供的RetinaNet深度学习目标检测模型结构图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例
图1为本发明实施例提供的一种尾矿库智能识别方法的流程图,本实施例可适用于对尾矿库进行识别的情况,具体包括如下步骤:
S110、对获取到的遥感图像进行预处理,以得到预处理后的遥感图像。
本实施例中,在大量收集遥感影像时,可以优先考虑分辨率精度优于0.5m的影像,以提高后续污染源识别的准确度。然后,对遥感影像进行切片、2%灰度值线性拉伸、图像格式转换等预处理操作,使得预处理后遥感图像格式与后续的深度目标检测模型相适应。
S120、对所述预处理后的遥感图像进行图像增强操作,以得到增强后的遥感图像。
进一步的,对预处理后的遥感图像进行亮度及对比度调节、伽马及仿射变换、对比度受限的直方图均衡等增强处理,以突出图像中关键特征,弱化图像中明暗色彩、角度变化、局部裁剪等因素的干扰,提高模型的泛化能力。
S130、基于深度学习目标检测模型对所述增强后的遥感图像进行训练,以得到训练后的尾矿库识别模型。
其中,本实施例中采用RetinaNet深度学习目标检测模型,来提取遥感图像中的尾矿库特征。
具体参见图2,本实施例中的RetinaNet深度学习目标检测模型由ResNet101框架、一个特征金字塔网络和两个全卷积网络组成。其中,特征金字塔网络能够针对多种尺度的特征进行融合和强化利用,生成更具代表性的包含多尺度尾矿信息的特征图。在特征金字塔结构的输出端加入了两个结构相同但并不共享参数的子网络,分别完成类别判断(是否为尾矿库)和位置回归任务。
进一步的,对上述构建的深度学习目标检测模型进行训练以及优化,使其适应尾矿库的特征分布。
由于本实施例中构建的RetinaNet网络为单阶段网络,在模型训练过程中,密集采样得到的候选特征图不再经由区域建议模块筛选,将直接在网络的末端生成预测并通过目标函数计算预测结果与真实标签的损失。因此,采样取得的负样本数量将远大于正样本,正负样本比例可能达到1:10000。在这种不均衡的正负样本分布下,预测结果与真实标签之间的损失将取决于大量的负样本损失。同时,大部分负样本的预测准确率较高,可能导致模型不能针对正样本和预测准确率较低的负样本进行学习。因此,本实施例中的深度学习目标检测模型采用了焦点损失(Focal Loss)目标函数,根据预测类别的置信度动态调节正负样本的损失权重。当预测结果的置信度提高,此时说明已经得到大量学习,能够较为容易地进行判断时,降低该类样本在目标函数中的权重。同理,当预测结果的置信度降低,此时说明识别该类样本较为困难时,提高该类样本在目标函数中的权重,针对该类样本进行重点训练。
其中,该深度学习目标检测模型的训练过程具体如下:首先人工筛选增强后的遥感图像,对各种尾矿库的坐标进行标注;然后将含有目标尾矿库的图像以及对应的坐标标签输入网络,通过随机梯度下降优化器训练网络中的参数;最后结合平均准确度、精确率、召回率等指标对训练结果进行量化评估。
训练完成后,结合评价结果,通过网络超参数调节、难负样本挖掘等方式对模型进行优化。
S140、将待识别的目标尾矿库图像输入所述尾矿库识别模型,以得到所述尾矿库识别模型输出的目标尾矿库的识别结果。
上述识别结果包括尾矿库的精确经纬度及其附近的遥感影像。
具体的,首先通过非最大值抑制的方式对所有预测进行筛选,去除重复的以及置信度较低的预测目标,然后结合遥感影像的地理信息计算目标的精确经纬度,输出尾矿库的地理位置及其附近的遥感影像。
本实施例的技术方案,通过将目标检测网络RetinaNet引入遥感影像尾矿库识别任务,通过深度残差网络框架ResNet101以及特征金字塔结构提取并融合图像中的浅层纹理信息及深层语义信息,通过焦点损失目标函数调节正负样本的损失权重,实现了遥感影像中尾矿库的精确定位。
本发明实施例还提供一种尾矿库智能识别装置,包括:
预处理模块,用于对获取到的遥感图像进行预处理,以得到预处理后的遥感图像;
图像增强模块,用于对所述预处理后的遥感图像进行图像增强操作,以得到增强后的遥感图像;
模型训练模块,用于基于深度学习目标检测模型对所述增强后的遥感图像进行训练,以得到训练后的尾矿库识别模型;
识别模块,用于将待识别的目标尾矿库图像输入所述尾矿库识别模型,以得到所述尾矿库识别模型输出的目标尾矿库的识别结果。
其中,所述深度学习目标检测模型包括深度残差网络框架ResNet框架和特征金字塔结构。
可选的,采用焦点损失函数作为所述深度学习目标检测模型训练过程中的目标函数。
上述识别模块具体用于:通过非最大值抑制的方式对所述尾矿库识别模型输出的所有识别结果进行筛选,以得到筛选后的识别结果;
通过遥感影像的地理信息计算所述筛选后的识别结果的精确经纬度信息,输出目标尾矿库的地理位置及其附近的遥感影像信息。
本发明实施例所提供的一种尾矿库智能识别装置可执行本发明任意实施例所提供的尾矿库智能识别方法,具备执行方法相应的功能模块和有益效果。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (5)
1.一种尾矿库智能识别方法,其特征在于,包括:
S110、对获取到的遥感图像进行预处理,以得到预处理后的遥感图像;
S120、对所述预处理后的遥感图像进行图像增强操作,以得到增强后的遥感图像;
S130、基于深度学习目标检测模型对所述增强后的遥感图像进行训练,以得到训练后的尾矿库识别模型;
S140、将待识别的目标尾矿库图像输入所述尾矿库识别模型,以得到所述尾矿库识别模型输出的目标尾矿库的识别结果。
2.根据权利要求1所述的方法,其特征在于,所述深度学习目标检测模型包括深度残差网络框架ResNet框架和特征金字塔结构。
3.根据权利要求2所述的方法,其特征在于,采用焦点损失函数作为所述深度学习目标检测模型训练过程中的目标函数。
4.根据权利要求1所述的方法,其特征在于,所述S140中所述尾矿库识别模型输出目标尾矿库的识别结果,包括:
通过非最大值抑制的方式对所述尾矿库识别模型输出的所有识别结果进行筛选,以得到筛选后的识别结果;
通过遥感影像的地理信息计算所述筛选后的识别结果的精确经纬度信息,输出目标尾矿库的地理位置及其附近的遥感影像信息。
5.一种尾矿库智能识别装置,其特征在于,包括:
预处理模块,用于对获取到的遥感图像进行预处理,以得到预处理后的遥感图像;
图像增强模块,用于对所述预处理后的遥感图像进行图像增强操作,以得到增强后的遥感图像;
模型训练模块,用于基于深度学习目标检测模型对所述增强后的遥感图像进行训练,以得到训练后的尾矿库识别模型;
识别模块,用于将待识别的目标尾矿库图像输入所述尾矿库识别模型,以得到所述尾矿库识别模型输出的目标尾矿库的识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210455836.5A CN114882375A (zh) | 2022-04-24 | 2022-04-24 | 一种尾矿库智能识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210455836.5A CN114882375A (zh) | 2022-04-24 | 2022-04-24 | 一种尾矿库智能识别方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114882375A true CN114882375A (zh) | 2022-08-09 |
Family
ID=82672442
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210455836.5A Pending CN114882375A (zh) | 2022-04-24 | 2022-04-24 | 一种尾矿库智能识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114882375A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117893015A (zh) * | 2024-01-17 | 2024-04-16 | 应急管理部大数据中心 | 用于尾矿库溃坝事故的风险人群分析方法及系统 |
-
2022
- 2022-04-24 CN CN202210455836.5A patent/CN114882375A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117893015A (zh) * | 2024-01-17 | 2024-04-16 | 应急管理部大数据中心 | 用于尾矿库溃坝事故的风险人群分析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110533084B (zh) | 一种基于自注意力机制的多尺度目标检测方法 | |
CN113469177B (zh) | 基于深度学习的排水管道缺陷检测方法及系统 | |
CN108460382B (zh) | 基于深度学习单步检测器的光学遥感图像舰船检测方法 | |
CN111339882B (zh) | 基于实例分割的输电线路隐患检测方法 | |
CN112232371B (zh) | 一种基于YOLOv3与文本识别的美式车牌识别方法 | |
CN116485709A (zh) | 一种基于YOLOv5改进算法的桥梁混凝土裂缝检测方法 | |
CN113989257A (zh) | 基于人工智能技术的电力综合管廊沉降裂缝识别方法 | |
CN115439458A (zh) | 基于深度图注意力的工业图像缺陷目标检测算法 | |
CN113435407B (zh) | 一种输电系统的小目标识别方法及装置 | |
CN114241332A (zh) | 一种基于深度学习的固废场识别方法、装置以及存储介质 | |
CN115965862A (zh) | 基于掩码网络融合图像特征的sar舰船目标检测方法 | |
CN111950357A (zh) | 一种基于多特征yolov3的船用水面垃圾快速识别方法 | |
CN114882375A (zh) | 一种尾矿库智能识别方法和装置 | |
CN111209919A (zh) | 一种海上船舶显著性检测方法及系统 | |
CN113610024B (zh) | 一种多策略的深度学习遥感影像小目标检测方法 | |
CN114926826A (zh) | 场景文本检测系统 | |
CN113469097B (zh) | 一种基于ssd网络的水面漂浮物多相机实时检测方法 | |
CN113988222A (zh) | 一种基于Faster-RCNN的森林火灾检测与识别方法 | |
CN113378642A (zh) | 一种对农村违法占地建筑物进行检测的方法 | |
CN113327253A (zh) | 一种基于星载红外遥感影像的弱小目标检测方法 | |
CN112084941A (zh) | 一种基于遥感图像的目标检测与识别方法 | |
CN115063679B (zh) | 一种基于深度学习的路面质量评估方法 | |
CN114782814A (zh) | 一种基于机器视觉的环境污染源识别方法和装置 | |
Liang et al. | Prohibited items detection in x-ray images based on attention mechanism | |
CN113505699A (zh) | 一种基于RetinaNet算法的船舶检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |