CN110188709A

CN110188709A - 基于深度学习的遥感影像中油桶的检测方法和检测系统

Info

Publication number: CN110188709A
Application number: CN201910474856.5A
Authority: CN
Inventors: 尹青山; 李锐; 段强
Original assignee: Jinan Inspur Hi Tech Investment and Development Co Ltd
Current assignee: Jinan Inspur Hi Tech Investment and Development Co Ltd
Priority date: 2019-06-03
Filing date: 2019-06-03
Publication date: 2019-08-30

Abstract

本发明公开了一种基于深度学习的遥感影像中油桶的检测方法和检测系统，属于深度学习领域，要解决的技术问题为如何借助深度学习实现对遥感影像中油桶的精确检测；方法包括：按照帧将监控视频分割为若干个像素比例相同的视频图像；对于每个视频图像标注人员位置和人员类型；通过Faster R‑CNN神经网络模型对标注后的视频图像进行检索训练；通过ResNet‑152CNN神经网络模型对标注后的视频图像进行分类训练；通过训练后Faster R‑CNN神经网络模型检索和训练ResNet‑152CNN神经网络模型检索实时监控视频。系统包括视频采集单元、标注单元、检索训练单元、分类训练单元和推理模块。

Description

基于深度学习的遥感影像中油桶的检测方法和检测系统

技术领域

本发明涉及深度学习领域，具体地说是一种基于深度学习的遥感影像中油桶的检测方法和检测系统。

背景技术

油桶目标一直以来都是军事打击的重要目标之一，在机场和港口军事遥感影像的毁伤信息提取和分析中，油桶目标的识别是油桶目标毁伤信息提取和分析的前提，其识别的准确度直接影响到毁伤信息提取和分析的效果。因此，研究遥感影像中油桶目标识别技术具有重要的意义。传统的油桶影像的检测有三种方法：基于Hough变换，该方法缺点是计算复杂、内存需求大；模板匹配方法，该方法准确率不高。利用油桶目标内部灰度值都比较均匀，与其相邻区域灰度值反差较大的影像辐射特征的油桶识别方法，该方法准确度不高。

深度学习的概念源于人工神经网络的研究，由Hinton等人于2006年提出。2006年，加拿大多伦多大学教授、机器学习领域的泰斗GeoffreyHinton和他的学生RuslanSalakhutdinov在《科学》上发表了一篇文章，开启了深度学习在学术界和工业界的浪潮。这篇文章有两个主要观点：(1)多隐层的人工神经网络具有优异的特征学习能力，学习得到的特征对数据有更本质的刻画，从而有利于可视化或分类；(2)深度神经网络在训练上的难度，可以通过“逐层初始化”(layer-wisepre-training)来有效克服，在文章中逐层初始化是通过无监督学习实现的。由此可见，深度学习的实质是通过构建具有很多隐层的机器学习模型和海量的训练数据，来学习更有用的特征，从而最终提升分类或预测的准确性。

借助机器学习领域深度学习研究的发展，识别技术得到突飞猛进的发展。将深度学习研究引入到识别领域，极大提高了识别的准确率降低了人的工作量。

基于上述分析，如何借助深度学习实现对遥感影像中油桶的精确检测，是需要解决的技术问题。

发明内容

本发明的技术任务是针对以上不足，提供一种基于深度学习的遥感影像中油桶的检测方法及检测系统，来解决如何借助深度学习实现对遥感影像中油桶的精确检测的问题。

第一方面，本发明提供一种基于深度学习的遥感影像中油桶的检测方法，包括：

按照帧将监控视频分割为若干个像素比例相同的视频图像；

对于每个视频图像标注人员位置和人员类型，人员类型包括工作人员和非工作人员；

通过Faster R-CNN神经网络模型对标注后的视频图像进行检索训练，生成训练后Faster R-CNN神经网络模型；

通过ResNet-152CNN神经网络模型对标注后的视频图像进行分类训练，生成训练后ResNet-152CNN神经网络模型；

通过训练后Faster R-CNN神经网络模型检索实时监控视频的人员位置，并通过训练后ResNet-152CNN神经网络模型检索实时监控视频的人员类型。

在上述实施方式中，Faster R-CNN神经网络模型是一个通用的物体检测模型，该模型能够自动识别图像中可识别对象在图像中的像素位置和对象类别，是基于深度学习的目标检测中应用最为广泛的模型。由于，Faster R-CNN神经网络模型的输入图像必须为相同像素比例的图像，即输入图像长与宽的像素相同且图像大小相同，所以需要将监控视频分割为像素比例相同的视频图像。

作为优选，通过labelImg工具对于每个视频图像标注人员位置和人员类型。

上述优选的实施方式中，labelImg工具为常用的一种图像标注工具。

作为优选，通过Faster R-CNN神经网络模型对标注后的视频图像进行检索训练，包括：

通过卷积层对视频图像进行特征提取，输出图像特征；

通过Region Proposal对图像特征进行学习，输出若干个感兴趣区域；

通过RoIHead对图像特征和感兴趣区域进行训练学习，判断感兴趣区域的类型，并对感兴趣区域的位置进行微调。

作为优选，卷积层为预训练的VGG16的卷积层。

第二方面，本发明提供一种基于深度学习的遥感影像中油桶的检测系统，包括：

视频采集单元，所述视频采集单元用于获取监控视频，并按照帧将监控视频分割为若干个像素比例相同的视频图像；

标注单元，所述标注单元用于对每个视频图像标注人员位置和人员类型，人员类型包括工作人员和非工作人员；

检索训练单元，所述检索训练单元用于通过Faster R-CNN神经网络模型对标注后的视频图像进行检索训练，生成训练后Faster R-CNN神经网络模型；

分类训练单元，所述分类训练单元通过ResNet-152CNN神经网络模型对标注后的视频图像进行分类训练，生成训练后ResNet-152CNN神经网络模型；

推理模块，所述推理模块用于通过训练后Faster R-CNN神经网络模型检索实时监控视频的人员位置，并通过训练后ResNet-152CNN神经网络模型检索实时监控视频的人员类型。

作为优选，标注单元配置有labelImg工具，labelImg工具用于对每个视频图像标注人员位置和人员类型。

作为优选，Faster R-CNN神经网络模型，包括：

卷积层，所述卷积层用于对视频图像进行特征提取，输出图像特征；

Region Proposal，所述Region Proposal用于对图像特征进行学习，输出若干个感兴趣区域；

RoIHead，所述RoIHead用于对图像特征和感兴趣区域进行训练学习，判断感兴趣区域的类型，并对感兴趣区域的位置进行微调。

作为优选，卷积层为预训练的VGG16的卷积层。

本发明的基于深度学习的遥感影像中油桶的检测方法及检测系统具有以下优点：训练Faster R-CNN神经网络模型以及ResNet-152CNN神经网络模型，通过训练后的FasterR-CNN神经网络模型检测人员位置，通过训练后的ResNet-152CNN神经网络模型检测人员类型，在两个模型的配合下提高识别的效率和准确度，快速精确的识别出施工现场的外来人员。

附图说明

为了更清除地说明本发明实施例中的技术方案，下面将对实施例中描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

下面结合附图对本发明进一步说明。

附图1为实施例1基于深度学习的遥感影像中油桶的检测方法流程框图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明，以使本领域的技术人员可以更好地理解本发明并能予以实施，但所举实施例不作为对本发明的限定，在不冲突的情况下，本发明实施例以及实施例中的技术特征可以相互结合。

本发明实施例提供基于深度学习的遥感影像中油桶的检测方法及检测系统，用于解决如何借助深度学习实现对遥感影像中油桶的精确检测的技术问题。

实施例1：

如附图1所示，本发明的基于深度学习的遥感影像中油桶的检测方法，包括：

S100、按照帧将监控视频分割为若干个像素比例相同的视频图像；

S200、对于每个视频图像标注人员位置和人员类型，人员类型包括工作人员和非工作人员；

S300、通过Faster R-CNN神经网络模型对标注后的视频图像进行检索训练，生成训练后Faster R-CNN神经网络模型；

S400、通过ResNet-152CNN神经网络模型对标注后的视频图像进行分类训练，生成训练后ResNet-152CNN神经网络模型；

S500、通过训练后Faster R-CNN神经网络模型检索实时监控视频的人员位置，并通过训练后ResNet-152CNN神经网络模型检索实时监控视频的人员类型。

其中，步骤S100中，将监控视频分割为若干个像素比例相同的视频图像，为视频图像长与宽的像素相同、且图像大小相同。以便于视频图像输入Faster R-CNN神经网络模型。

步骤S200中，可通过常用的标注工具在视频图像中标注人员位置和人员类型，本实施例中选用labelImg进行标注。

步骤S300中，Faster R-CNN神经网络模型包括卷积层、Region Proposal和RoIHead，卷积层为预训练的VGG16的卷积层，通过该Faster R-CNN神经网络模型对标注后的视频图像进行检索训练，包括如下步骤：

S310、通过卷积层对视频图像进行特征提取，输出图像特征；

S320、通过Region Proposal对图像特征进行学习，输出若干个感兴趣区域；

S330、通过RoIHead对图像特征和感兴趣区域进行训练学习，判断感兴趣区域的类型，并对感兴趣区域的位置进行微调。

步骤S400中，ResNet-152CNN神经网络模型选用现有的常用的模型，对视频图像进行分类训练，输出人员类型，并得到训练后ResNet-152CNN神经网络模型。

通过步骤S300和步骤S400，得到训练后Faster R-CNN神经网络模型和训练后ResNet-152CNN神经网络模型，将上述两个模型保存在本地。对于实时采集到的监控视频，通过训练后的Faster R-CNN神经网络模型对实时监控视频进行人员位置检测，通过训练后ResNet-152CNN神经网络模型对实时监控视频进行人员类型检测。该方法应用于工地上时，可快速精确的识别出工地外来人员。

实施例2：

本发明的基于深度学习的遥感影像中油桶的检测系统，包括：视频采集单元、标注单元、检索训练单元、分类训练单元和推理模块。

视频采集单元配置有摄像头和图像分割模块，通过该摄像头获取监控视频，通过图像分割模块按照帧将监控视频分割为若干个像素比例相同的视频图像。像素比例相同的视频图像指长与宽像素相同、且图像大小相同的视频图像。

标注单元内配置有标注工具，通过标注工具对每个视频图像标注人员位置和人员类型，人员类型包括工作人员和非工作人员。本实施例中配置的标注工具为labelImg工具。

检索训练单元，配置有Faster R-CNN神经网络模型，标注单元输出的标注后视频图像输入检索训练单元，在检索训练单元内通过Faster R-CNN神经网络模型对标注后的视频图像进行检索训练，生成训练后Faster R-CNN神经网络模型，并将生成的训练后FasterR-CNN神经网络模型保存在推理模块。

分类训练单元，配置有ResNet-152CNN神经网络模型，标注单元输出的标注后视频图像输入检索训练单元，通过ResNet-152CNN神经网络模型对标注后的视频图像进行分类训练，生成训练后ResNet-152CNN神经网络模型，并将生成的训练后ResNet-152CNN神经网络模型保存在推理模块，

推理模块，存储有训练后Faster R-CNN神经网络模型和训练后ResNet-152CNN神经网络模型，通过视频采集单元输出的视频图像输入该推理模块，通过训练后Faster R-CNN神经网络模型检索实时监控视频的人员位置，并通过训练后ResNet-152CNN神经网络模型检索实时监控视频的人员类型，从而可精确实现人员识别以及人员位置的定位。

本实施例的基于深度学习的遥感影像中油桶的检测系统可实现实施例1公开的基于深度学习的遥感影像中油桶的检测方法。

以上所述实施例仅是为充分说明本发明而所举的较佳的实施例，本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换，均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。

Claims

1.基于深度学习的遥感影像中油桶的检测方法，其特征在于包括：

按照帧将监控视频分割为若干个像素比例相同的视频图像；

2.根据权利要求1所述的基于深度学习的遥感影像中油桶的检测方法，其特征在于通过labelImg工具对于每个视频图像标注人员位置和人员类型。

3.根据权利要求1所述的基于深度学习的遥感影像中油桶的检测方法，其特征在于通过Faster R-CNN神经网络模型对标注后的视频图像进行检索训练，包括：

通过卷积层对视频图像进行特征提取，输出图像特征；

4.根据权利要求3所述的基于深度学习的遥感影像中油桶的检测方法，其特征在于卷积层为预训练的VGG16的卷积层。

5.基于深度学习的遥感影像中油桶的检测系统，其特征在于包括：

6.根据权利要求5所述的基于深度学习的遥感影像中油桶的检测系统，其特征在于标注单元配置有labelImg工具，labelImg工具用于对每个视频图像标注人员位置和人员类型。

7.根据权利要求5所述的基于深度学习的遥感影像中油桶的检测系统，其特征在于Faster R-CNN神经网络模型，包括：

8.根据权利要求7所述的基于深度学习的遥感影像中油桶的检测系统，其特征在于卷积层为预训练的VGG16的卷积层。