CN111339893A - 基于深度学习和无人机的管道检测系统及方法 - Google Patents

基于深度学习和无人机的管道检测系统及方法 Download PDF

Info

Publication number
CN111339893A
CN111339893A CN202010106868.5A CN202010106868A CN111339893A CN 111339893 A CN111339893 A CN 111339893A CN 202010106868 A CN202010106868 A CN 202010106868A CN 111339893 A CN111339893 A CN 111339893A
Authority
CN
China
Prior art keywords
prediction
image
unmanned aerial
aerial vehicle
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010106868.5A
Other languages
English (en)
Other versions
CN111339893B (zh
Inventor
夏红伟
田震
李莉
马广程
裘水军
张利强
裴敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wei Fu Lai Zhejiang Technology Co ltd
Harbin Institute of Technology
Original Assignee
Wei Fu Lai Zhejiang Technology Co ltd
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wei Fu Lai Zhejiang Technology Co ltd, Harbin Institute of Technology filed Critical Wei Fu Lai Zhejiang Technology Co ltd
Priority to CN202010106868.5A priority Critical patent/CN111339893B/zh
Publication of CN111339893A publication Critical patent/CN111339893A/zh
Application granted granted Critical
Publication of CN111339893B publication Critical patent/CN111339893B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30164Workpiece; Machine component

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Remote Sensing (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Multimedia (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Astronomy & Astrophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Quality & Reliability (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Automation & Control Theory (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种基于深度学习和无人机的管道检测系统及方法,属于工业机器人领域。本发明地面站部分包括数据管理模块和无线通信模块一,机载部分包括无线通讯模块二、可见光相机、红外相机、检测系统机载控制部分和存储器;该方法为采用双边滤波器对图像进行去噪;采用Canny算子对图像进行边缘检测再映射回原始图像进行锐化操作;使用卷积和池化运算简化成为特征提取网络可以识别的特征图;构建RPN网络对特征图中的目标框进行预测回归;通过SoftNMS进行标准后处理,保留预测分数最高的预测框作为检测输出;生成目标掩膜图像即最终的管道检测图片。本发明输油管道漏电识别准确率高,效率高;实现了输油管道自动化检测,节省了人力成本,提高了工作效率。

Description

基于深度学习和无人机的管道检测系统及方法
技术领域
本发明涉及基于深度学习和无人机的管道检测系统及方法,属于工业机器人领域。
背景技术
论文《油气管道智能巡检系统的设计与实现》中以输油管道的日常巡视与维修要求为背景,利用GPS定位技术、GIS(地理信息系统)和数据传输技术实现了油气管道的智能巡检管理。利用油田以及石油输油管道已经存在的GIS数据,通过图形化的形式向石油输油管道巡检人员的巡检的路程以及待测的故障点进行直观的展示,通过GPS对石油输油管道巡检人员的路线以及位置进行定位,从而能够对于石油输油管道巡检人员工作的状态进行及时全程监控;对于有可能存在问题石油输油管道以及附属设备,可以向管理中心及时进行信息的反馈,而管理中心基于GIS系统内全部的空间数据以及属性数据进行全面分析,最终获得最有效的解决方案,并向现场工作人员进行反馈。基于数量丰富的地理信息对输油管道沿线的运行情况进行详细的说明,从而构建数字化的输油管道,通过地理信息使得工作人员能够对输油管道的各种信息能够做到实时、详尽、准确的把握,同时,给工作人员操作以及管理决策提供依据。进而可以实现科学有效的管理输油管道运行,从而使得工作效率以及工作质量得到提高。论文《油气管道智能巡检系统的设计与实现》中以输油管道的日常巡视与维修要求为背景,利用GPS定位技术、GIS(地理信息系统)和数据传输技术实现了油气管道的智能巡检管理,但是需要使用大量的人力物力,需要人员去野外巡检,容易发生效率低等问题。
专利《一种长输油气管道巡检方法及系统》提出了一套基于采集点的管理系统,以解决现有技术中不能及时获得巡检人员完成巡检任务的完成率的技术问题。采集获得巡检关键点的坐标信息,所述坐标信息由位于对应巡检关键点的定位设备采集获得;设定每个巡检关键点在不同时段的控制距离,进而获得多个对应关系表,基于所述坐标信息设置巡检计划,确定出第一巡检人员的巡检任务,将所述巡检任务发送至所述第一巡检人员的移动终端;接收所述移动终端上报的所述第一巡检人员的巡检记录,确定出所述第一巡检人员每次巡检的实际巡检距离以及实际巡检频次,预设巡检频次确定出所述第一巡检人员完成所述巡检任务的完成率。也即是,可以基于第一巡检人员的移动终端上报的第一巡检人员的巡检记录确定出第一巡检人员完成巡检任务的完成率。专利《一种长输油气管道巡检方法及系统》,以解决现有技术中不能及时获得巡检人员完成巡检任务的完成率的技术问题,虽然在某种程度上提高了工作人员的效率,但是需要人员去野外进行巡检,成本高,且工作人员易发生危险。
专利《一种基于无人机的油气管道巡检系统及巡检方法》提出了提出一种基于无人机的油气管道巡检系统及巡检方法,可以进行大规模、高效的油气管道巡检。无人机飞行过程中,第一微处理器实时采集和处理飞机状态信息,处理后的数据保存在数据存储模块,同时,经数传电台发送给地面站。同时发出指令,实时调整无人机的飞行状态。第二微处理器实时采集高清运动摄像头采集的油气管道图像,第二微处理器通过SPI总线将电源检测模块的数据发送给第一微处理器,并经第一数传电台发送至地面站,地面站可以实时显示所拍摄的油气管道图像。专利《一种基于无人机的油气管道巡检系统及巡检方法》提出了提出一种基于无人机的油气管道巡检系统及巡检方法,可以进行大规模、高效的油气管道巡检,但是其检测的数据只是传回了地面站,需要人亲自去进行管道检测,没有完全实现检测自动化。
发明内容
本发明的目的是为了解决上述现有技术存在的问题,进而提供一种基于深度学习和无人机的管道检测系统及方法。
本发明的目的是通过以下技术方案实现的:
一种基于深度学习和无人机的管道检测系统,所述基于深度学习和无人机的管道检测系统包括地面站和机载两部分,地面站部分包括数据管理模块和无线通信模块一,机载部分包括无线通讯模块二、可见光相机、红外相机、检测系统机载控制部分和存储器,地面站上的数据管理模块与无线通讯模块一连接,机载部分搭载无线通讯模块二、可见光相机、红外相机和存储器,可见光相机、红外相机和存储器将数据传送到无人机检测系统机载控制部分,地面站的无线通讯模块一与机载上的无线通讯模块二之间进行无线通讯。
基于深度学习和无人机的管道检测系统,所述无人机采用大疆公司生产MG-1PRTK版农业植保机。
基于深度学习和无人机的管道检测系统,所述红外相机为摄徒D900高清1080P红外夜视摄像机,可见光相机为MS-UB500C。
一种基于深度学习和无人机的管道检测系统的检测方法,具体步骤为:
步骤一:检测系统采用双边滤波器对可见光相机和红外相机采集的管道图像进行去噪;
步骤二:采用Canny算子对步骤一去噪后的图像进行边缘检测再映射回原始图像进行锐化操作;
步骤三:使用卷积和池化运算将步骤三处理后的图像简化成为特征提取网络可以识别的特征图;
步骤四:构建RPN网络对特征图中的目标框进行预测回归;
步骤五:通过SoftNMS对步骤四中由RPN网络生成的目标候选区域进行标准后处理,去除重合度较高的预测框,只保留预测分数最高的预测框作为检测输出;
步骤六:在掩模生成网络中,使用FCN全卷积层对图像进行分割,全卷积层进行反卷积操作,设定和分类数目相同的卷积通道对图像进行上采样,将特征图以与特征提取网络相同的倍数放大到原图像尺寸,生成目标掩膜图像即为最终的管道检测图片。
基于深度学习和无人机的管道检测方法,所述步骤三的具体过程为:特征提取网络采用ResNet101网络,并且使用Feature Pyramid Network方法,构建特征金字塔,在多层特征上进行预测,增加特征映射的分辨率:
ResNet网络中的残差结构通过跨层链接在进行数据优化时可以得到线性映射,ResNet对残差函数和输入映射两个部分进行拆分,首先学习残差函数F(X)然后对输入进行映射X,得到新的函数H(X),通过使用瓶颈式残差块提升网络的训练速度,构建了分别为1x1,3x3,1x1三个卷积层来减少模型的输出特征的尺寸;
步骤二的图像输入到网络层中,首先对图像进行预处理变为1030x1030x3的尺寸,然后依次通过特征提取网络的stage1到stage5层,其中每个stage在进行卷积化运算后先对数据进行标准化处理,然后使用ReLU激活函数进行激活,最后输出经过处理的图像特征;
在经过特征提取网络处理之后,网络将每个stage连接到FPN金字塔由自顶而下进行不同尺度的特征融合得到新的特征。
基于深度学习和无人机的管道检测方法,所述步骤四的具体操作为:FPN金字塔产生了三种尺度,因此在构建RPN网络时,对每一个尺度的特征图构建相同尺度的锚框,对每个特征像素点都应建立不同尺寸的3个锚框,分别是横长方形预选框,纵长方形预选框和正方形预选框。
基于深度学习和无人机的管道检测方法,所述步骤五的具体操作为:
首先需要得出每个预测框的位置和大小信息,然后从概率最大预测框和其重叠的预测框的重叠区域是否大于设定值这个标准进行其他框的保留和删除,重叠区域面积由以下式确定:
Figure BDA0002388449740000041
其中:IOU:交并比
A∩B:A和B的交集
A∪B:A和B的并集
A:概率最大预测框
B:重叠预测框
一般将重叠率大于0.7的设为正样本预测框,重叠率小于0.3的设置为负样本预测框;当重叠面积大于设定值时留下最大概率预测框,其他删除;然后对留下的预测框继续判断重叠面积进行删除;重复执行上面操作,直至找出所有预测框;
通过对预测框分类概率的预测,可以得到预测框的预测概率;通过非极大抑制可以找到最大概率预测框,但是预测框可能并不能完全覆盖目标或覆盖区域过多,因此需要对预测框坐标尺寸进行调整;通过手动标注图片的标注框信息,可以使用反向传播网络确定预测框偏移量大小,设定偏移值分别是中心点坐标dx(P)和dy(P),两个尺寸偏移dw(P)和dh(P)通过网络训练可以得到预测框表达函数
Figure BDA0002388449740000051
其中:
Figure BDA0002388449740000052
x的估计值
Figure BDA0002388449740000053
y的估计值
Figure BDA0002388449740000054
宽度w的估计值
Figure BDA0002388449740000055
高度h的估计值
Px:x的输入值
Py:y的输入值
Pw:宽度w的输入值
Ph:高度h的输入值
dx(P):坐标x的偏移预测值
dy(P):坐标y的偏移预测值
dw(P):宽度w的偏移预测值
dh(P):高度h的偏移预测值
将d(P)建立成为由
Figure BDA0002388449740000061
表示对P进行优化的线性函数,得到
Figure BDA0002388449740000062
其中:
Figure BDA0002388449740000063
对应锚框的特征图组成的特征向量
W:需要进行学习的偏移参数
d(P):得到的偏移预测值
为了让预测值和真实值差距最小,我们定义代价函数如下:
Figure BDA0002388449740000064
由此,可以得到对W进行优化的表达式:
Figure BDA0002388449740000065
其中:λ:Lagrange乘数
t由以下公式定义
(T在这里是对矩阵进行的一个转置操作,不是一个新的变量,因此不需要进行备注)
Figure BDA0002388449740000066
其中:Gx:x的真实值
Gy:y的真实值
Gw:宽度w的真实值
Gh:高度h的真实值
至此可以通过偏移量对预测框进行调整从而得到真正的目标区域。
本发明基于深度学习和无人机的管道检测系统及方法,输油管道漏电识别准确率高,效率高;本发明实现了输油管道自动化检测,节省了人力成本,提高了工作效率。
附图说明
图1为本发明基于深度学习和无人机的管道检测系统及方法的框图。
图2为无人机巡检系统的框图。
图3为本发明基于深度学习和无人机的管道检测方法中图像处理方案。
图4为本发明基于深度学习和无人机的管道检测方法中双边滤波处理后的效果图。
图5为本发明基于深度学习和无人机的管道检测方法中通过Canny锐化后的效果图。
图6为本发明基于深度学习和无人机的管道检测方法的特征网络结构图。
图7为本发明基于深度学习和无人机的管道检测方法中残差块结构图。
图8为本发明基于深度学习和无人机的管道检测方法特征网络图。
图9为本发明基于深度学习和无人机的管道检测方法中FPN网络结构图。
图10为本发明基于深度学习和无人机的管道检测方法的分类网络系统具体流程图。
具体实施方式
下面将结合附图对本发明做进一步的详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式,但本发明的保护范围不限于下述实施例。
实施例一:如图1-2所示,本实施例所涉及的一种基于深度学习和无人机的管道检测系统,无人机的巡检系统分为机上巡检系统和地面站巡检系统两部分,其中机上巡检系统由无人机、检测、无线通讯、数据管理四个分系统组成(如图2所示)。
地面站系统是整个巡线系统的指挥中心,其主要任务就是飞行操纵,航线制定,接受巡线图像信息,并将其实时的显示出来,无线通信,以及数据的传输与处理。
无人机分系统主要是无人机机体选择与控制。无人机主要分为固定翼无人机、无人直升机和多旋翼无人机三大类,各类无人机特性及适用场所各有不同,主要特性对比分析见表1。针对输油管道所处复杂山区的特点,需要对线路重点区域进行精确检测,紧急情况下对目标区域长时间检测,要求无人机具备低空飞行和滞空悬停能力。由于气田集输管道呈散射状,地理位置分散,重点地段较多,巡检次数频繁,应急抢险阶段需应急通信车配合使用,因此选用便携性好、机动灵活性强、展开时间短、对起降场地要求不高的多旋翼无人机作为管道日常巡线、重点地段的精细勘察与应急检测的主要装备。
表1 主要无人机性能
Figure BDA0002388449740000081
一般无人机的飞行控制系统都需要具有以下功能:
a)在任何气流情况下都要保持稳定的飞行姿态;
b)在给定高度保持飞行的平稳性;
c)按照给定航向角保持飞行的平稳性;
d)采集飞行信息,并及时发送给地面控制台;
e)发出控制指令时,可实时的做出相应的动作;
f)具备应急处理的功能;
综上所述,本系统选择大疆公司生产MG-1PRTK版农业植保机,该品牌支持一控多机,一个遥控器最多可协调5架MG-1P系列植保机同时进行作业,单人作业效率成倍提升。新一代智能遥控器控制距离提升至3000米,支持同等距离高清图传,加入了4G通讯功能,电池、天线采用可更换式设计。采用D-RTK高精度导航定位技术,定位精度达厘米级,航线轨迹精确可重复调用;双天线测向技术具有强大的抗磁干扰能力,保障MG-PRTK在高压线附近等复杂环境中稳定飞行,经过讨论,该无人机满足本系统的性能。
检测分系统由地面站及机载部分组成,如图1所示,其中无人机地面站部分是将通过无线通讯得到的机载检测部分的信息进行实时处理,它是对输油管道状态的诊断评估,是依赖图像识别技术的系统。此系统对通过可见光相机或红外热像仪(红外相机)拍摄的实时图像进行处理和识别,提取图像的特征,同时依据图像的特征来自动的诊断管道的故障,从而实现系统相应的功能。
无人机的机载部分搭载有可见光相机、红外线相机以及存储器等设备,用于对输油管道及周围相关设备的搜寻及拍摄,并实时的通过无线通讯传给地面站。可见光相机主要用于对输油管道线路的检测和巡检。红外线相机主要用于查找由各种故障引起的局部热点。
本系统选用的红外相机为摄徒D900高清1080P红外夜视摄像机,可见光相机为MS-UB500C,经过讨论,可以满足系统的性能。
无人机的无线通信系统包括用于将控制信息从地面站发送到无人机也即上行通道和将无人机的各种飞行状态及采集到的各种信息发送到地面即下行通道。对于无人机巡线系统来说无线通信系统通常包括数据和图像两个传输系统。数据传输系统主要用于完成无人机各种飞行状态数据的上下行传输,以实现对无人机的实时控制。图像传输系统主要用于可见光及红外视频的上下行传输,以确保检测设备拍到的图像实时的传输到地面站。
本系统的无线通信分系统由LC6600组网模块组成,LC6600是一款点对多宽带接入及数据传输模块,具备星型组网功能,可以支持一个中心节点和16个子节点,并分享20mbps传输带宽实现长距离、多节点的720p的视频传输。其低成本,高性价比的产品特征,可以满足本系统的需求。
数据管理分系统主要由图像与管道线的自动匹配和图像的自动拼接两个模块组成。其主要功能是在离线的情况下对机载部分检测到的图像数据与数据库中已存在的数据进行比较,将图像与管道线路进行一一匹配,然后确定图像与管道线路对应关系,再进行图像的智能化分析,从而生成缺陷报告。通过数据管理分系统对检测精度和后台检测效率都有明显的提高,对故障的查询以及集中管理更有益处。
实施例二:如图3-10所示,本实施例所涉及的一种基于深度学习和无人机的管道检测方法,基于深度学习的输油管道检测分系统,其主要是将无人机采集来的输油管道图片进行处理,通过训练好的神经网络模型,对其中的可能存在的漏点区域进行标注,从而实现检测的自动化,其方案如图3所示。
具体步骤实施如下:
(1)图片预处理
采用双边滤波对图像进行去噪,由于输油管道裂缝比较尖锐,对边缘保存要求比较高,双边滤波器基于空间分布的高斯滤波函数可以做到很好的边缘保存,在边缘附近,离的较远的像素不会对边缘上的像素值产生太大影响。基于此我们采用双边滤波器对图片进行去噪,其处理后的效果如图4所示。
采用Canny算子对去噪后的图像进行边缘检测再映射回原始图像进行锐化操作。通过Canny锐化后的效果如图5所示。
(2)特征提取网络设计
特征提取网络基础结构如图6所示,使用卷积和池化运算将图像简化成为神经网络可以识别的特征图,减少后面网络的计算量,滤除不重要的干扰信息。因此特征提取网络的设计尤为重要,提取网络的性能好坏直接影响到识别的准确度。
一般来说,网络深度越深,分类精度越精确,但是由此带来梯度消失的隐患,使得训练速度变慢,影响分类精度。综合考虑,本系统采用ResNet101网络作为我们的特征提取网络,并且使用Feature Pyramid Network方法,构建特征金字塔,在多层特征上进行预测,增加特征映射的分辨率,提高垃圾分类的准确性与鲁棒性。
ResNet网络中的残差结构通过跨层链接在进行数据优化时可以的到线性映射。ResNet对两个部分进行拆分,首先学习残差函数然后对输入进行映射得到新的函数。通过使用瓶颈式残差块提升网络的训练速度。构建了分别为1x1,3x3,1x1三个卷积层来减少模型的输出特征的尺寸,有效降低了模型训练时间。残差块如图7所示。
图像输入到网络层中,首先对图像进行预处理变为1030x1030x3的尺寸。然后依次通过stage1到stage5层。其中每个stage在进行卷积化运算后先对数据进行标准化处理,然后使用ReLU激活函数进行激活。最后输出经过处理的图像特征。如图8所示的使用ReLU激活函数得5个Stage模块。
在经过ResNet处理之后,网络将每个stage连接到FPN金字塔由自顶而下进行不同尺度的特征融合得到新的特征,来确保特征符合尺寸要求,其结构如图9所示。在融合之后使用3x3的卷积核进行卷积来消除混叠效应。新的特征命名为P2,P3,P4,P5,P6。其中P6是对P5进行最大池化得到,不参与分类,只参与RPN网络推荐。
为了减小计算量并同时增强了网络拟合性能,我们使用多个集成的小卷积核代替带大卷积核,卷积层分为5个部分,每个部分实现多个瓶颈残差块网络。具体结构参数如表2所示。
表2 特征提取网络结构参数
Figure BDA0002388449740000111
(3)RPN网络设计
RPN网络的输入可以是任何尺寸的图像,输出是一组矩形目标候选区域以及每个区域的得分,通过FPN网络产生了不同尺寸的特征图,现在构建RPN网络对特征图中的目标框进行预测回归。由于上面的FPN金字塔产生了三种尺度。因此在构建RPN网络时对每一个尺度的特征图构建相同尺度的锚框(anchor),对每个特征像素点都应建立不同尺寸的3个锚框(anchor),分别是横长方形预选框,纵长方形预选框和正方形预选框。对应每一金字塔层的锚框(anchor)大小和数量如表3所示。
表3 锚框尺寸和分类
Figure BDA0002388449740000121
我们使用SoftNMS对检测模型进行标准后处理,用于去除重合度(IOU)较高的预测框,只保留预测分数最高的预测框作为检测输出,其具体操作如下:
首先需要得出每个预测框的位置和大小信息,然后从概率最大预测框和其重叠的预测框的重叠区域是否大于设定值。重叠区域面积由以下式确定:
Figure BDA0002388449740000122
一般将重叠率大于0.7的设为正样本预测框,重叠率小于0.3的设置为负样本预测框。当重叠面积大于设定值时留下最大概率预测框,其他删除。然后对留下的预测框继续判断重叠面积进行删除。重复执行上面操作,直至找出所有预测框。
通过对预测框分类概率的预测,可以得到预测框的预测概率。通过非极大抑制可以找到最大概率预测框。但是预测框可能并不能完全覆盖目标或覆盖区域过多。因此需要对预测框坐标尺寸进行调整。通过对手动标注图片的标注框信息,可以使用反向传播网络确定预测框偏移量大小。设定偏移值分别是中心点坐标dx(P)和dy(P),两个尺寸偏移dw(P)和dh(P)通过网络训练可以得到预测框表达函数
Figure BDA0002388449740000123
可以将d(P)建立成为由
Figure BDA0002388449740000124
表示对P进行优化的线性函数。得到
Figure BDA0002388449740000125
其中W是需要进行学习的偏移参数。可以得到对W进行优化的表达式:
Figure BDA0002388449740000131
其中t由以下公式定义(T在这里是对矩阵进行的一个转置操作)
Figure BDA0002388449740000132
至此可以通过偏移量对预测框进行调整从而得到真正的目标区域。
(4)分类网络设计
在掩模生成网络中,使用FCN全卷积层对图像进行分割,全卷积层进行反卷积操作,设定和分类数目相同的卷积通道对图像进行上采样。将特征图以与特征提取网络相同的倍数放大到原图像尺寸,生成目标掩膜图像。
我们使用ROI align对由RPN网络生成的ROI进行处理,ROI align使用双线性内插值的方法对预选框进行分割,然后对分割出的区域进行最大池化,有效避免了分割过程中的边界非整数因素的积累,提高了识别的准确度。经过有关实验,得出如下结论:预测框划分成为2x2个小预测框单元性能最好,由此得到对预测框进行双线性插值的过程,其具体算法如下:
假设预选框划分小单元中心点定位到一个非离散化的像素坐标位置。该位置上有邻近的四个像素点分别为:P11=(x1,y1),p12=(x1,y2),P21=(X2,Y1),P22=(x2,y2)四个点,需要预测的点位置为P=(x,y)。其中x,y都是非整数。可以得到在x方向上的线性插值:
Figure BDA0002388449740000133
也可以得到在y方向的插值:
Figure BDA0002388449740000134
由于双线性插值的存在,我们将ROI align的反向传播算法进行更改。
Figure BDA0002388449740000135
在经过ROI align结构后我们可以得到推荐区域特征,通过全连接层得到区域类别分类和坐标系修正项。此时需要生成图像掩膜信息。
首先将区域推荐特征信息根据不同的制度进行分级。一共有5个尺度级别(C1,C2,C3,C4,C5)。分级标准由以下式进行定义:
Figure BDA0002388449740000141
其中,wh-特征图面积;
k0设定的初始值
k0的作用就是将目标的大小进行分级对比。由于需要检测的抓取目标尺度大多集中在2个尺度上,因此可以设定k0=3这样特征便被分类到两个尺度级别(C4,C5)中。
将分级过后的特征信息送入四层卷积网络使用ReLU函数进行激活,在卷积层后继续追加一个逆卷积网络。逆卷积操作就是在卷积神经网络中转换正向和反向运算。在反向传播时可以得到
Figure BDA0002388449740000142
其中,C为正向卷积运算y=Cx得到的一个稀疏矩阵。
生成新的特征图是原尺寸的2倍。通过类比卷积尺寸公式可以得到反卷积的尺寸公式:
o=s(i-1)+k-2p
式中,i-输入图像的尺寸;
p-图像边框填充值padding;
s-步长;
k-卷积核大小
可以得知逆卷积运算使图像尺度变成特征图的两倍。最终掩膜信息被放大到原图像的边界尺寸,得到掩膜图像输出,即最终的管道检测图片。其系统具体流程如图10所示。
以上所述,仅为本发明较佳的具体实施方式,这些具体实施方式都是基于本发明整体构思下的不同实现方式,而且本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (7)

1.一种基于深度学习和无人机的管道检测系统,其特征在于,所述基于深度学习和无人机的管道检测系统包括地面站和机载两部分,地面站部分包括数据管理模块和无线通信模块一,机载部分包括无线通讯模块二、可见光相机、红外相机、检测系统机载控制部分和存储器,地面站上的数据管理模块与无线通讯模块一连接,机载部分搭载无线通讯模块二、可见光相机、红外相机和存储器,可见光相机、红外相机和存储器将数据传送到无人机检测系统机载控制部分,地面站的无线通讯模块一与机载上的无线通讯模块二之间进行无线通讯。
2.根据权利要求1所述的基于深度学习和无人机的管道检测系统,其特征在于,所述无人机采用大疆公司生产MG-1PRTK版农业植保机。
3.根据权利要求1所述的基于深度学习和无人机的管道检测系统,其特征在于,所述红外相机为摄徒D900高清1080P红外夜视摄像机,可见光相机为MS-UB500C。
4.如权利要求1-3所述的一种基于深度学习和无人机的管道检测系统的检测方法,其特征在于,具体步骤为:
步骤一:检测系统采用双边滤波器对可见光相机和红外相机采集的管道图像进行去噪;
步骤二:采用Canny算子对步骤一去噪后的图像进行边缘检测再映射回原始图像进行锐化操作;
步骤三:使用卷积和池化运算将步骤三处理后的图像简化成为特征提取网络可以识别的特征图;
步骤四:构建RPN网络对特征图中的目标框进行预测回归;
步骤五:通过SoftNMS对步骤四中由RPN网络生成的目标候选区域进行标准后处理,去除重合度较高的预测框,只保留预测分数最高的预测框作为检测输出;
步骤六:在掩模生成网络中,使用FCN全卷积层对图像进行分割,全卷积层进行反卷积操作,设定和分类数目相同的卷积通道对图像进行上采样,将特征图以与特征提取网络相同的倍数放大到原图像尺寸,生成目标掩膜图像即为最终的管道检测图片。
5.根据权利要求1所述的基于深度学习和无人机的管道检测方法,其特征在于,所述步骤三的具体过程为:特征提取网络采用ResNet101网络,并且使用Feature PyramidNetwork方法,构建特征金字塔,在多层特征上进行预测,增加特征映射的分辨率:
ResNet网络中的残差结构通过跨层链接在进行数据优化时可以得到线性映射,ResNet对残差函数和输入映射两个部分进行拆分,首先学习残差函数F(X)然后对输入进行映射X,得到新的函数H(X),通过使用瓶颈式残差块提升网络的训练速度,构建了分别为1x1,3x3,1x1三个卷积层来减少模型的输出特征的尺寸;
步骤二的图像输入到网络层中,首先对图像进行预处理变为1030x1030x3的尺寸,然后依次通过特征提取网络的stage1到stage5层,其中每个stage在进行卷积化运算后先对数据进行标准化处理,然后使用ReLU激活函数进行激活,最后输出经过处理的图像特征;
在经过特征提取网络处理之后,网络将每个stage连接到FPN金字塔由自顶而下进行不同尺度的特征融合得到新的特征。
6.根据权利要求1或5所述的基于深度学习和无人机的管道检测方法,其特征在于,所述步骤四的具体操作为:FPN金字塔产生了三种尺度,因此在构建RPN网络时,对每一个尺度的特征图构建相同尺度的锚框,对每个特征像素点都应建立不同尺寸的3个锚框,分别是横长方形预选框,纵长方形预选框和正方形预选框。
7.根据权利要求1所述的基于深度学习和无人机的管道检测方法,其特征在于,所述步骤五的具体操作为:
首先需要得出每个预测框的位置和大小信息,然后从概率最大预测框和其重叠的预测框的重叠区域是否大于设定值这个标准进行其他框的保留和删除,重叠区域面积由以下式确定:
Figure FDA0002388449730000031
其中:IOU:交并比
A∩B:A和B的交集
A∪B:A和B的并集
A:概率最大预测框
B:重叠预测框
一般将重叠率大于0.7的设为正样本预测框,重叠率小于0.3的设置为负样本预测框;当重叠面积大于设定值时留下最大概率预测框,其他删除;然后对留下的预测框继续判断重叠面积进行删除;重复执行上面操作,直至找出所有预测框;
通过对预测框分类概率的预测,可以得到预测框的预测概率;通过非极大抑制可以找到最大概率预测框,但是预测框可能并不能完全覆盖目标或覆盖区域过多,因此需要对预测框坐标尺寸进行调整;通过手动标注图片的标注框信息,可以使用反向传播网络确定预测框偏移量大小,设定偏移值分别是中心点坐标dx(P)和dy(P),两个尺寸偏移dw(P)和dh(P)通过网络训练可以得到预测框表达函数
Figure FDA0002388449730000032
其中:
Figure FDA0002388449730000033
x的估计值
Figure FDA0002388449730000034
y的估计值
Figure FDA0002388449730000035
宽度w的估计值
Figure FDA0002388449730000041
高度h的估计值
Px:x的输入值
Py:y的输入值
Pw:宽度w的输入值
Ph:高度h的输入值
dx(P):坐标x的偏移预测值
dy(P):坐标y的偏移预测值
dw(P):宽度w的偏移预测值
dh(P):高度h的偏移预测值
将d(P)建立成为由
Figure FDA0002388449730000042
表示对P进行优化的线性函数,得到
Figure FDA0002388449730000043
其中:
Figure FDA0002388449730000044
对应锚框的特征图组成的特征向量
W:需要进行学习的偏移参数
d(P):得到的偏移预测值
为了让预测值和真实值差距最小,我们定义代价函数如下:
Figure FDA0002388449730000045
由此,可以得到对W进行优化的表达式:
Figure FDA0002388449730000046
其中:λ:Lagrange乘数
t由以下公式定义
(T在这里是对矩阵进行的一个转置操作,不是一个新的变量,因此不需要进行备注)
Figure FDA0002388449730000051
其中:Gx:x的真实值
Gy:y的真实值
Gw:宽度w的真实值
Gh:高度h的真实值
至此可以通过偏移量对预测框进行调整从而得到真正的目标区域。
CN202010106868.5A 2020-02-21 2020-02-21 基于深度学习和无人机的管道检测系统及方法 Active CN111339893B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010106868.5A CN111339893B (zh) 2020-02-21 2020-02-21 基于深度学习和无人机的管道检测系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010106868.5A CN111339893B (zh) 2020-02-21 2020-02-21 基于深度学习和无人机的管道检测系统及方法

Publications (2)

Publication Number Publication Date
CN111339893A true CN111339893A (zh) 2020-06-26
CN111339893B CN111339893B (zh) 2022-11-22

Family

ID=71184170

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010106868.5A Active CN111339893B (zh) 2020-02-21 2020-02-21 基于深度学习和无人机的管道检测系统及方法

Country Status (1)

Country Link
CN (1) CN111339893B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112258496A (zh) * 2020-11-02 2021-01-22 郑州大学 一种基于全卷积神经网络的地下排水管道病害分割方法
CN112434880A (zh) * 2020-12-10 2021-03-02 清研灵智信息咨询(北京)有限公司 基于深度学习的巡检路线规划及巡检人员管理系统
CN112488061A (zh) * 2020-12-18 2021-03-12 电子科技大学 一种联合ads-b信息的多航空器检测与跟踪方法
CN112926531A (zh) * 2021-04-01 2021-06-08 深圳市优必选科技股份有限公司 特征信息提取方法、模型训练方法、装置及电子设备
CN112949614A (zh) * 2021-04-29 2021-06-11 成都市威虎科技有限公司 一种自动分配候选区域的人脸检测方法及装置和电子设备
CN113780113A (zh) * 2021-08-25 2021-12-10 廊坊中油朗威工程项目管理有限公司 管道违章行为识别方法
CN113837199A (zh) * 2021-08-30 2021-12-24 武汉理工大学 一种基于跨层残差双路金字塔网络的图像特征提取方法
CN114354082A (zh) * 2022-03-18 2022-04-15 山东科技大学 一种基于仿鲟鱼吻须的海底管道智能循迹系统和循迹方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105805560A (zh) * 2016-03-04 2016-07-27 南昌航空大学 一种基于无人机的天然气管道泄漏检测系统
CN206656942U (zh) * 2017-04-20 2017-11-21 南京科盛环保技术有限公司 基于无人机的工厂污染气体排放的监测系统
US20180165554A1 (en) * 2016-12-09 2018-06-14 The Research Foundation For The State University Of New York Semisupervised autoencoder for sentiment analysis
CN108229319A (zh) * 2017-11-29 2018-06-29 南京大学 基于帧间差异与卷积神经网络融合的船舶视频检测方法
CN108399380A (zh) * 2018-02-12 2018-08-14 北京工业大学 一种基于三维卷积和Faster RCNN的视频动作检测方法
CN108460341A (zh) * 2018-02-05 2018-08-28 西安电子科技大学 基于集成深度卷积网络的光学遥感图像目标检测方法
WO2019222383A1 (en) * 2018-05-15 2019-11-21 Northeastern University Multi-person pose estimation using skeleton prediction
CN110636255A (zh) * 2019-08-21 2019-12-31 西南交通大学 一种基于4g网络的无人机图像、视频传输分发系统及方法
CN110673628A (zh) * 2019-09-20 2020-01-10 北京航空航天大学 一种复合翼无人机油气管线巡检方法
CN110674861A (zh) * 2019-09-19 2020-01-10 国网山东省电力公司电力科学研究院 一种输变电巡检图像智能分析方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105805560A (zh) * 2016-03-04 2016-07-27 南昌航空大学 一种基于无人机的天然气管道泄漏检测系统
US20180165554A1 (en) * 2016-12-09 2018-06-14 The Research Foundation For The State University Of New York Semisupervised autoencoder for sentiment analysis
CN206656942U (zh) * 2017-04-20 2017-11-21 南京科盛环保技术有限公司 基于无人机的工厂污染气体排放的监测系统
CN108229319A (zh) * 2017-11-29 2018-06-29 南京大学 基于帧间差异与卷积神经网络融合的船舶视频检测方法
CN108460341A (zh) * 2018-02-05 2018-08-28 西安电子科技大学 基于集成深度卷积网络的光学遥感图像目标检测方法
CN108399380A (zh) * 2018-02-12 2018-08-14 北京工业大学 一种基于三维卷积和Faster RCNN的视频动作检测方法
WO2019222383A1 (en) * 2018-05-15 2019-11-21 Northeastern University Multi-person pose estimation using skeleton prediction
CN110636255A (zh) * 2019-08-21 2019-12-31 西南交通大学 一种基于4g网络的无人机图像、视频传输分发系统及方法
CN110674861A (zh) * 2019-09-19 2020-01-10 国网山东省电力公司电力科学研究院 一种输变电巡检图像智能分析方法及装置
CN110673628A (zh) * 2019-09-20 2020-01-10 北京航空航天大学 一种复合翼无人机油气管线巡检方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112258496A (zh) * 2020-11-02 2021-01-22 郑州大学 一种基于全卷积神经网络的地下排水管道病害分割方法
CN112434880A (zh) * 2020-12-10 2021-03-02 清研灵智信息咨询(北京)有限公司 基于深度学习的巡检路线规划及巡检人员管理系统
CN112488061A (zh) * 2020-12-18 2021-03-12 电子科技大学 一种联合ads-b信息的多航空器检测与跟踪方法
CN112926531A (zh) * 2021-04-01 2021-06-08 深圳市优必选科技股份有限公司 特征信息提取方法、模型训练方法、装置及电子设备
CN112926531B (zh) * 2021-04-01 2023-09-26 深圳市优必选科技股份有限公司 特征信息提取方法、模型训练方法、装置及电子设备
CN112949614A (zh) * 2021-04-29 2021-06-11 成都市威虎科技有限公司 一种自动分配候选区域的人脸检测方法及装置和电子设备
CN113780113A (zh) * 2021-08-25 2021-12-10 廊坊中油朗威工程项目管理有限公司 管道违章行为识别方法
CN113837199A (zh) * 2021-08-30 2021-12-24 武汉理工大学 一种基于跨层残差双路金字塔网络的图像特征提取方法
CN113837199B (zh) * 2021-08-30 2024-01-09 武汉理工大学 一种基于跨层残差双路金字塔网络的图像特征提取方法
CN114354082A (zh) * 2022-03-18 2022-04-15 山东科技大学 一种基于仿鲟鱼吻须的海底管道智能循迹系统和循迹方法
CN114354082B (zh) * 2022-03-18 2022-05-31 山东科技大学 一种基于仿鲟鱼吻须的海底管道智能循迹系统和循迹方法

Also Published As

Publication number Publication date
CN111339893B (zh) 2022-11-22

Similar Documents

Publication Publication Date Title
CN111339893B (zh) 基于深度学习和无人机的管道检测系统及方法
WO2022111219A1 (zh) 一种域自适应设备运检系统和方法
CN108229587B (zh) 一种基于飞行器悬停状态的输电杆塔自主扫描方法
CN112505065B (zh) 一种实现室内无人机对大部件表面缺陷进行检测的方法
CN110246175A (zh) 全景相机与云台相机结合的变电站巡检机器人图像检测系统及方法
CN111244822B (zh) 一种复杂地理环境的固定翼无人机巡线方法、系统和装置
Kim et al. UAV-UGV cooperative 3D environmental mapping
CN113284144B (zh) 一种基于无人机的隧道检测方法及装置
WO2021083151A1 (zh) 目标检测方法、装置、存储介质及无人机
CN114089786A (zh) 一种基于无人机视觉的沿山区公路自主巡检系统
CN114782626A (zh) 基于激光与视觉融合的变电站场景建图及定位优化方法
CN111985352A (zh) 一种ai前端化的变电站巡检视频实时识别方法及系统
CN114034296A (zh) 一种导航信号干扰源检测与识别方法及系统
CN111914615A (zh) 基于立体视觉的消防区域可通过性分析系统
CN114841944B (zh) 基于挂轨轨道机器人的尾矿坝表面形变巡检方法
CN116797944A (zh) 一种基于无人机图像识别光伏面板清洁度的检测方法及系统
CN112632415B (zh) 一种Web地图实时生成方法及图像处理服务器
CN111476062A (zh) 车道线检测方法、装置、电子设备及驾驶系统
CN102123234B (zh) 无人机侦察视频分级运动补偿方法
CN115355952B (zh) 一种原油储罐智能巡检系统
CN114217641B (zh) 一种非结构环境下无人机送变电设备巡检方法及系统
CN115622231A (zh) 一种光伏发电站智能运维系统
CN109117852A (zh) 基于稀疏表示的无人机图像适配区自动提取方法及系统
CN114743116A (zh) 一种基于营房巡视场景的无人值守专用载荷系统及方法
CN112286230A (zh) 无人机视觉图像算法、避障步骤及其信息融合处理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant