CN112734732B - 基于改进ssd算法的铁路隧道漏缆卡具检测方法 - Google Patents
基于改进ssd算法的铁路隧道漏缆卡具检测方法 Download PDFInfo
- Publication number
- CN112734732B CN112734732B CN202110033763.6A CN202110033763A CN112734732B CN 112734732 B CN112734732 B CN 112734732B CN 202110033763 A CN202110033763 A CN 202110033763A CN 112734732 B CN112734732 B CN 112734732B
- Authority
- CN
- China
- Prior art keywords
- layer
- network
- detection
- model
- ssd
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 84
- 238000000034 method Methods 0.000 claims abstract description 38
- 230000006870 function Effects 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 18
- 238000011176 pooling Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000015556 catabolic process Effects 0.000 claims description 4
- 238000006731 degradation reaction Methods 0.000 claims description 4
- 230000007246 mechanism Effects 0.000 claims description 4
- 230000001629 suppression Effects 0.000 claims description 4
- 230000003213 activating effect Effects 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims 1
- 238000003672 processing method Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于改进SSD算法的铁路隧道漏缆卡具检测方法,涉及图像处理方法技术领域。该方法使用不同尺度的特征图检测卡具目标,并在网络宽度和网络深度上对SSD的网络结构加以改进。其主要通过结合Inception结构增加网路宽度;采用残差结构在提高网络深度的同时优化网络深度结构;使用深度可分离卷积和1x1卷积结构减少模型参数量,改善模型结构,提高模型检测效率。将改进后的模型应用于隧道漏缆卡具图像的检测,实验结果表明,该方法检测的平均准确率达到了86.6%,检测速度达到了26.6fps,相比于原始SSD算法和MobileNet SSD算法具有明显优势。
Description
技术领域
本发明涉及图像检测方法技术领域,尤其涉及一种基于改进SSD算法的铁路隧道漏缆卡具检测方法。
背景技术
随着高速铁路的快速发展,高铁安全运营的重要性日益凸显。铁路移动通讯系统是保障铁路无线通信的重要环节,山区、隧道通信网络的覆盖主要依靠泄漏电缆。通信泄漏同轴电缆通常悬挂在隧道壁上,并由卡具固定。当高速行驶的列车经过时产生的气压和能量波会对卡具产生一定的冲击,同时卡具还受到各种环境因素的影响,很容易发生松动甚至脱落,一旦发生故障很容易造成交通事故,并严重影响铁路的安全运营。
为了确保铁路移动通信系统的安全运行,有必要定期检查隧道内的漏缆卡具。目前,隧道内漏缆卡具检测的方法主要有两种:纯手动检测和采集视频回放检测。目前,铁路部门隧道内漏缆卡具的检测大多还停留在纯手动检测阶段,每月进行一次人工检查。人工检查受到环境因素,地理因素和人为因素的影响,检查效率低,工作量大,耗费大量的人力、资金和设备等,尤其在崎岖的地形或隧道内照明不足的情况下难以进行检查,而且极易发生漏检的情况,检测结果难以保证。另外,随着高速铁路的不断发展,隧道的数量和长度也在不断增加,有时甚至一条隧道长达几十公里,给卡具维护人员带来了巨大的挑战。在采集视频回放检测的阶段,通常在火车窗口中安装一个高速摄像机,以收集和存储在火车整个运行过程中拍摄的图像。尽管图像经过了一些简单的操作,例如压缩处理和定位识别,但它在列车运行过程中存储了所有视频数据,并且需要手动回放来确认故障点。这样会造成存储数据量大,检测周期长以及难以定位到故障点等缺点。因此,铁路部门对解决隧道内漏缆卡具的智能检测有着十分迫切的需求。
近年来,深度学习以其强大的学习能力在目标检测领域得到了成功应用。与机器学习相比,它不需要人工提取目标特征,可以实现端到端的检测。目前主流的基于深度学习的目标检测算法通常可分为one-stage算法和two-stage算法。其中,基于区域的two-stage算法主要包括R-CNN,Fast R-CNN和Faster R-CNN。基于回归的one-stage算法主要有YOLO和SSD。基于two-stage的算法一般精度高,但速度慢,实时性较差。在基于回归的one-stage算法中,YOLO算法速度较快,但精度不高。SSD算法结合了YOLO的回归思想和Faster R-CNN的anchor机制,既保持了YOLO速度快的特性,也保证了检测结果跟Faster R-CNN一样比较精准,具有广阔的应用前景。
发明内容
本发明所要解决的技术问题是如何提供一种能够快速准确检测隧道内的漏缆卡具的检测方法。
为解决上述技术问题,本发明所采取的技术方案是:一种基于改进SSD算法的铁路隧道漏缆卡具检测方法,其特征在于包括如下步骤:
构建改进的SSD网络模型;
通过所述SSD网络模型对隧道漏缆卡具图像进行检测,并输出检测结果。
进一步的技术方案在于,所述改进的SSD网络模型的构建方法如下:
在SSD算法的基础上,通过堆叠Block增加网络深度,结合残差机制解决网络退化问题并加入深度可分离卷积和1x1卷积提高其检测速度。
进一步的技术方案在于:结合Inception网络的相关组成结构,通过对输入的上层网络,分别进行1x1卷积,3x3深度可分离卷积和3x3最大值池化,并将检测结果拼接起来传入下层网络操作。
进一步的技术方案在于:通过堆叠Block加深网络深度,通过在卷积层之后激活函数之前加入批量归一化,将需要传递的特征规范化,同时在网络训练中,批量归一化算法将一个最小批次中的所有样本关联起来,使得网络可以从同一批次的所有样本中关联得出结果;引入ResNet网络中的残差结构,在每个Block的输入在输出前直接叠加在Inception结构的输出中。
进一步的技术方案在于:残差单元可以将学习一个恒等映射函数H(x)=x转化成学习一个残差函数F(x)=H(x)-x;当残差F(x)=0时,此时叠加的卷积层只是做了恒等映射。
进一步的技术方案在于:通过深度可分离卷积进行网络参数优化。
进一步的技术方案在于:改进的SSD网络模型包括依次连接的Input(300*300*3)层、Conv1(300*300*64)层、Block1,2(300*300*64)层、Block3-6(150*150*128)层、Block7-10(75*75*256)层、Block11,14(38*38*512)层、Block15-18(19*19*1024)层、Block19-22(10*10*1024)层、Conv6_1(10*10*256)层、Conv6_2(5*5*512)层、Conv7_1(5*5*128)层、Conv7_2(3*3*256)层、Conv8_1(3*3*128)层、Conv8_2(2*2*256)层、Conv9_1(2*2*128)层和Conv9_2(1*1*256)层;其中括号中前面的两个数字表示图片的大小,后一个数字表示通道的个数;分别抽取Block15-18(19*19*1024)层、Block19-22(10*10*1024)层、Conv6_2(5*5*512)层、Conv7_2(3*3*256)层、Conv8_2(2*2*256)层以及Conv9_2(1*1*256)层的特征图输入到Detection检测模块进行检测,检测后的数据通过非极大值抑制NMS模块进行处理后得到置信度最高的检测结果。
进一步的技术方案在于:每个Block模块包括1x1卷积模块、3x3深度可分离卷积模块和3x3最大值池化模块。
进一步的技术方案在于:SSD模型的先验框通过如下方法计算:
在生成先验框时,以每个特征图上的点作为中心点,生成一系列的同心先验框,同时在不同特征图上,每个中心点生成的先验框个数并不完全相同;先验框的设置,主要包括尺度和宽高比两个方面;当使用m个特征图做预测,每个特征图默认框的比例为:
其中,smin取0.2,smax取0.95,所有层规矩间隔;先验框的宽度和高度可以通过ar来进行调整,计算公式如下:
进一步的技术方案在于:SSD模型的损失函数的计算方法如下:
损失函数是通过分类置信度损失和位置回归损失两部分加权和得到,即:
其中,分类置信度损失为:
位置回归损失为:
采用上述技术方案所产生的有益效果在于:该方法使用不同尺度的特征图检测卡具目标,并在网络宽度和网络深度上对SSD的网络结构加以改进。其主要通过结合Inception结构增加网路宽度;采用残差结构在提高网络深度的同时优化网络深度结构;使用深度可分离卷积和1x1卷积结构减少模型参数量,改善模型结构,提高模型检测效率。将改进后的模型应用于隧道漏缆卡具图像的检测,实验结果表明,该方法检测的平均准确率达到了86.6%,检测速度达到了26.6fps,相比于原始SSD算法和MobileNet SSD算法具有明显优势。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1是本发明实施例所述方法中改进的SSD网络模型图;
图2是本发明实施例所述方法中改进SSD的Block结构图;
图3是本发明实施例所述方法中残差单元的原理框图;
图4a是本发明实施例中故障卡具示例图;
图4b是本发明实施例中良好卡具示例图;
图5a是本发明实施例中SSD训练损失变化图;
图5b是本发明实施例中MobileNet SSD训练损失变化图;
图5c是本发明实施例中本发明所述方法的训练损失变化图;
图6是本发明实施例中模型检测结果示例图;
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
SSD目标检测算法
SSD模型:SSD是一种基于回归的目标检测算法,该方法是一种直接预测目标包围框的坐标和类别的目标检测算法,利用不同分辨率卷积层的特征图,可以针对不同大小的物体进行检测。SSD模型的主网络结构是VGG16,将其中的最后两个全连接层改成了卷积层,接着增加了4个卷积层来构造网络结构。该模型一共从网络结构中抽取了6层特征图用于检测,这些层的大小逐渐减小呈现出金字塔结构[11],使其可以在大的特征图上检测小目标,在小的特征图上检测大目标,从而实现多尺度目标检测。
先验框计算:SSD模型主要在大小为(38,38),(19,19),(10,10),(5,5),(3,3)和(1,1)的特征图上进行检测。在不同的特征图上先验框的设置不同。
在生成先验框时,以每个特征图上的点作为中心点,生成了一系列的同心先验框,同时在不同特征图上,每个中心点生成的先验框个数并不完全相同。先验框的设置,主要包括尺度和宽高比两个方面。当使用m个特征图做预测,每个特征图默认框的比例为:
其中,smin取0.2,smax取0.95,所有层规矩间隔。先验框的宽度和高度可以通过ar来进行调整,计算公式如下:
1.3损失函数
实验通过损失函数计算真实值与预测值的误差。SSD算法的损失函数是通过分类置信度损失和位置回归损失两部分加权和得到,即:
其中,分类置信度损失为:
位置回归损失为:
总体的,本发明实施例公开了一种基于改进SSD算法的铁路隧道漏缆卡具检测方法,包括如下步骤:
构建改进的SSD网络模型;
通过所述SSD网络模型对隧道漏缆卡具图像进行检测,并输出检测结果。
本申请主要采用了增加网络深度和宽度的方法。其中,网络的深度指的是网络的层数,宽度指的是每层的通道数。改进后的模型在网络宽度上,主要通过采用Inception网络结构,每个Block均结合了1x1卷积,3x3深度可分离卷积以及3x3池化的操作,使每个Block可以提取到更多的特征信息。该模型通过堆叠Block,增加了网络深度,并结合残差机制[13]解决网络深度增加而带来的模型退化的问题。为了解决模型复杂度增加而带来的参数量急剧上升的问题,加入了深度可分离卷积和1x1卷积,提高其检测速度。改进后的网络结构如图1所示,Block内的结构模块如图2所示。特征图大小的过渡采用步长为2的深度可分离卷积实现。
进一步的,如图1所示,进的SSD网络模型包括依次连接的Input(300*300*3)层、Conv1(300*300*64)层、Block1,2(300*300*64)层、Block3-6(150*150*128)层、Block7-10(75*75*256)层、Block11,14(38*38*512)层、Block15-18(19*19*1024)层、Block19-22(10*10*1024)层、Conv6_1(10*10*256)层、Conv6_2(5*5*512)层、Conv7_1(5*5*128)层、Conv7_2(3*3*256)层、Conv8_1(3*3*128)层、Conv8_2(2*2*256)层、Conv9_1(2*2*128)层和Conv9_2(1*1*256)层;其中括号中前面的两个数字表示图片的大小,后一个数字表示通道的个数;分别抽取Block15-18(19*19*1024)层、Block19-22(10*10*1024)层、Conv6_2(5*5*512)层、Conv7_2(3*3*256)层、Conv8_2(2*2*256)层以及Conv9_2(1*1*256)层的特征图输入到Detection检测模块进行检测,检测后的数据通过非极大值抑制NMS模块进行处理后得到置信度最高的检测结果。
将改进后的模型应用于隧道漏缆卡具图像的检测,实验结果表明,该方法检测的平均准确率达到了86.6%,检测速度达到了26.6fps,相比于原始SSD算法和MobileNet SSD算法具有明显优势。
网络宽度:网络宽度与每层网络可以提取到的特征数量相关,在一定程度上提升模型的网络宽度可以使特征提取网络得到更多的特征信息,对提高目标检测的精确度有一定的帮助。本申请改进的SSD网络模型结合了Inception网络的相关组成结构,通过对输入的上层网络,分别进行1x1卷积,3x3深度可分离卷积和3x3最大值池化,并将检测结果拼接起来传入下层网络等操作,增加了SSD主干网络的宽度,使模型可以提取到更多有用的特征。为了减少模型参数,模型没有采用5x5卷积的部分。本申请改进SSD的网络结构模块如图2所示。改进后的结构结合了稀疏结构,将不同大小的卷积核卷积得到的结果和池化得到的结果,通过密集的结构模块来替代最优的局部系数结构,可以减小由于参数增加而带来的过拟合现象。
网络深度:本申请改进SSD模型通过堆叠Block加深了网络深度,由于网络层数的加深在一定程度上可以提高模型的非线性表达能力,使得模型可以学习到一些更加复杂的变换,有效提高模型对特征的拟合能力。较深的网络模型汇集了各种低、中、高不同层次的特征,具有鲜明的特征层次。因此,在构建卷积网络时,网络的深度越深,可抽取的特征层次就越丰富。为此,该模型使用更深层次的网络结构,以便取得更多层次的特征。对于梯度消失和爆炸问题,通过在卷积层之后激活函数之前加入批量归一化,将需要传递的特征规范化,可以有效地解决此问题,保证网络的稳定性。同时在网络训练中,批量归一化算法将一个最小批次中的所有样本关联起来,使得网络可以从同一批次的所有样本中关联得出结果。由于每次网络选取的样本批次都是随机的,因此网络不会单独朝一个方向学习,这从一定程度上减小了过拟合的风险。
网络深度增加,也会使模型产生退化现象。如深层的网络结构可能比浅层的网络效果更差,这并不是由过拟合产生的,而主要是由冗余的网络层学习了不是恒等映射的参数造成的。为了解决模型退化问题,我们引入了ResNet网络[15]中的残差结构。在图2中,每个Block的输入都可以在输出前直接叠加在Inception结构的输出中,保证随着网络深度的增加,该模型可以通过恒等映射退化为一个浅层网络,保证模型的检测效果。
该结构主要解决了当网络深度增加时,深层网络可以实现恒等映射的问题。即当深层网络的后面层是恒等映射,该模型就退化为一个浅层网络。残差单元如图3所示。该结构可以将学习一个恒等映射函数H(x)=x转化成学习一个残差函数F(x)=H(x)-x。这样拟合残差函数更加容易。当残差F(x)=0时,此时叠加的卷积层只是做了恒等映射,可以保证至少网络性能不会下降,这也使得深层网络在输入特征基础上学习到新的特征,从而拥有更好的性能。
网络参数优化:结构的调整,模型的复杂度明显增加,模型总的参数量也逐渐加大,为了保证模型的检测速度不至于大幅度降低,该模型使用深度可分离卷积替换了传统的卷积运算。深度可分离卷积将传统卷积分成了深度卷积和点卷积。当输入特征图为Fs×Fs×M,输出特征图为Fs×Fs×N,卷积核为Fk×Fk时,传统的卷积运算量Sc为:
Sc=Fk×Fk×M×N×Fs×Fs (8)
深度可分离卷积的计算量Sn为深度卷积和点卷积的计算量之和:
Sn=Fk×Fk×M×Fs×Fs+M×N×Fs×Fs (9)
深度可分离卷积与传统卷积的计算量之比为:
实验过程:
本实验采用的硬件环境为:Intel Xeon E5-2697v2,NVIDIA GeForce GTX1080Ti,采用了tensorflow平台用于训练和测试工作。在实验中,数据来源于现场实测数据,由架设在高铁内窗上的高速双线CMOS相机采集的隧道内视频数据,经处理共获得3552张原始夹具数据。采集到的卡具示例如图4a-图4b所示。其中,75%的图像作为训练数据集,剩下的25%作为测试数据集。
实验将原始卡具分为良好卡具和故障卡具两种类型,并对卡具目标进行标注。在训练过程中,由于网络模型较为复杂,因此在批量归一化操作中选用输入的批次大小为4。在网络的训练过程中,将一定批次大小的卡具图片及其对应的真实框坐标和标签输入到网络,把图片尺寸调整为300×300,通过SSD算法的主干网路提取特征,在Block18,Block22,Conv6_1,Conv7_1,Conv8_1,Conv9_1这六个特征层上分别生成anchor。结合分类损失和位置回归损失,预测anchor的分类及坐标,然后将预测结果整合在一起,通过与真实框的IOU匹配,返回anchor对应的包围框坐标及分类标签,最后通过非极大值抑制得到置信度最高的检测结果。此外在先验框生成中,结合本实验中卡具的结构特征,将其中先验框宽高比由(1/3,3)改为了(2/3,3/2)。
实验中对训练数据进行了数据增强,因为当训练数据不足时,模型从原始数据中获得的信息相对较少,这可能会导致过拟合的风险。在这种情况下,模型的效果很难保证。因此,我们使用先验信息对原始数据进行处理,通过对原始数据进行调节亮度、对比度、旋转、翻转、模糊和加噪声等操作,实现了数据增强的效果。
在训练过程中,改进后的SSD模型及其对照模型的训练损失和验证损失随迭代次数的变化情况如图5a-5c所示。其中,SSD算法和MobileNet SSD算法均加载了预训练模型,损失函数在初始时较低,损失函数随迭代次数的增加逐渐降低,但是变化的幅度相对较小。改进后的模型在训练过程中并未加载预训练模型,因此初始时损失函数较高,随着迭代次数的增加,模型逐渐学习到的特征信息逐渐增多,损失函数也能够逐渐降低至最低值。
实验结果
在检测精度方面,一般使用mAP(mean AveragePrecision)衡量所有类别的平均准确率。在本实验中,所提出的模型和对照算法之间的精度对比如表1所示。
表1算法精度对比表
本申请改进SSD算法,对故障卡具的检测精度有了一定的提升,有一定的原因是模型增加了网络宽度和网络深度,可以提取到卡具更多的特征。这些特征对模型学习故障卡具类型时,能够起到更好的效果。相对于原始的SSD算法,MobileNet SSD算法和本申请改进的SSD算法在良好卡具的检测精度上降低了5%左右,这些有一部分原因与特征提取层相关。原始的SSD算法在特征图大小为(38,38),(19,19),(10,10),(5,5),(3,3)和(1,1)上进行检测,而本申请改进SSD和MobileNet SSD并没有利用(38,38)特征图上的信息,而是在特征图大小为(3,3)和(1,1)之间添加了一层(2,2)大小的特征图,即利用(19,19),(10,10),(5,5),(3,3),(2,2),(1,1)大小的特征图进行检测,这增加了模型对高层信息的处理能力,也能够减少模型的参数总量,提高模型检测速度。改进后的模型虽然对良好卡具的检测精度有所降低但是其在故障卡具的检测精度有了较大幅度的提升,综合性能更加优异。
在故障卡具的检测上,MobileNet SSD算法的精度降低了7.7%,而本申请改进SSD算法的精度比原始SSD算法提高了6%,从一定程度上证明了改进后的模型在特征提取网络上的特征提取能力有了显著的提高。前者可能由于模型较小,模型的能力相对于原始SSD有所下降,而后者模型更加复杂,参数量较多,使用深度可分离卷积能达到更好的效果。同时,由于改进后的模型在较小的特征图上提取的特征相对更多,在高层特征图上能够获得更加有效的故障卡具的特征,对提高故障类型卡具的检测精度也有一定的帮助。结合实际应用场景,模型对故障卡具检测精度的提升更有益于指导工程项目的运行。
在检测速度方面,主要的评价指标有fps,此外,由于模型的检测速度与模型总的参数量相关,一般情况下,随着参数量的减少,模型的检测速度逐渐增加。为此,在本实验中统计了模型在训练过程中总的参数量个数。改进后的算法和对照试验的检测结果如表2所示。
表2速度属性对比表
从表2中可以看出,以VGG16为主网络结构的SSD算法模型参数总计23879570个是MobileNet SSD算法的3.7倍,是本申请改进SSD算法的2.2倍,因此,使用深度可分离卷积和1x1卷积可以有效地减少模型参数量。但是由表1可知,MobileNet SSD模型在卡具检测中,平均检测精度为79.7%,而且对于故障卡具地检测精度只有67.3%,在实际的检测中虽然速度较快,但是精度难以满足实际需求。为此,本申请改进的SSD算法,在一定程度上提高了模型复杂度,相比于MobileNet SSD算法,模型的参数量有所增加,但还是远低于SSD算法的参数量。改进后的模型在检测速度上相比于原始的SSD算法有了明显提升。
本申请改进SSD算法的实验部分检测结果如图6所示。结合表1和表2中所得数据,原始的SSD算法整体模型参数量较多,检测速度较慢为21.5fsp,平均检测精度为86%。MobileNet SSD算法整体参数量最少,但在一定程度上由于模型简单,模型的检测能力较差。本申请改进SSD模型通过采用深度可分离卷积和使用了大量1x1卷积有效的减少了模型参数量,相比于原始的SSD算法,检测速度有了明显提升,同时改进后的模型从网络宽度和网络深度两个方向对模型加以优化,提高了模型复杂度,模型的特征提取能力也得到了一定改善,相比于原始的SSD算法,mAP提高了0.6%。此外,模型对故障卡具的检测精度不够好,有一定原因是虽然对卡具数据进行了一定的数据增强操作,但是相对于良好卡具,故障卡具的数量依然较少,模型对故障卡具的学习能力并没有达到最好。随着后期工作的进展,故障数据采集增多,模型能够从数据中提取到更加丰富的特征,对故障卡具的检测结果也能进一步提高。
Claims (6)
1.一种基于改进SSD算法的铁路隧道漏缆卡具检测方法,其特征在于包括如下步骤:
1)构建改进的SSD网络模型;
所述改进的SSD网络模型,其特征在于:通过堆叠Block增加网络深度,并结合残差机制解决网络退化问题并加入深度可分离卷积和1x1卷积提高其检测速度;结合Inception网络的相关组成结构,通过对输入的上层网络,分别进行1x1卷积,3x3深度可分离卷积和3x3最大值池化,并将检测结果拼接起来传入下层网络操作;
所述改进的SSD网络模型包括依次连接的Input(300*300*3)层、Conv1 (300*300*64)层、Block1,2 (300*300*64)层、Block3-6 (150*150*128)层、Block7-10 (75*75*256)层、Block11,14 (38*38*512)层、Block15-18 (19*19*1024)层、Block19-22(10*10*1024)层、Conv6_1(10*10*256)层、Conv6_2(5*5*512)层、Conv7_1(5*5*128)层、Conv7_2(3*3*256)层、Conv8_1(3*3*128)层、Conv8_2(2*2*256)层、Conv9_1(2*2*128)层和Conv9_2(1*1*256)层;其中括号中前面的两个数字表示图片的大小,后一个数字表示通道的个数;分别抽取Block15-18 (19*19*1024)层、Block19-22(10*10*1024)层、Conv6_2(5*5*512)层、Conv7_2(3*3*256)层、Conv8_2(2*2*256)层以及Conv9_2(1*1*256)层的特征图输入到Detection检测模块进行检测,检测后的数据通过非极大值抑制NMS模块进行处理后得到置信度最高的检测结果;
2)通过所述SSD网络模型对隧道漏缆卡具图像进行检测,并输出检测结果。
3.如权利要求1所述的基于改进SSD算法的铁路隧道漏缆卡具检测方法,其特征在于:通过深度可分离卷积进行网络参数优化。
4.如权利要求1所述的基于改进SSD算法的铁路隧道漏缆卡具检测方法,其特征在于:每个Block模块包括1x1卷积模块、3x3深度可分离卷积模块和3x3最大值池化模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110033763.6A CN112734732B (zh) | 2021-01-11 | 2021-01-11 | 基于改进ssd算法的铁路隧道漏缆卡具检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110033763.6A CN112734732B (zh) | 2021-01-11 | 2021-01-11 | 基于改进ssd算法的铁路隧道漏缆卡具检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112734732A CN112734732A (zh) | 2021-04-30 |
CN112734732B true CN112734732B (zh) | 2023-06-02 |
Family
ID=75590246
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110033763.6A Active CN112734732B (zh) | 2021-01-11 | 2021-01-11 | 基于改进ssd算法的铁路隧道漏缆卡具检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112734732B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113674222A (zh) * | 2021-07-29 | 2021-11-19 | 宁波大学 | 基于改进fssd的汽车差速器壳体表面缺陷的快速检测方法 |
CN114842320A (zh) * | 2022-03-17 | 2022-08-02 | 江南大学 | 基于DW-SEnet模型的机器人目标检测方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112149533A (zh) * | 2020-09-10 | 2020-12-29 | 上海电力大学 | 一种基于改进ssd模型的目标检测方法 |
-
2021
- 2021-01-11 CN CN202110033763.6A patent/CN112734732B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112149533A (zh) * | 2020-09-10 | 2020-12-29 | 上海电力大学 | 一种基于改进ssd模型的目标检测方法 |
Non-Patent Citations (5)
Title |
---|
"INCEPTION SINGLE SHOT MULTIBOX DETECTOR FOR OBJECT DETECTION";Chengcheng Ning etc.;《Proceedings of the IEEE International Conference on Multimedia and Expo Workshops》;20170714;论文第3节 * |
"Xception:Deep Learning with Depthwise Separable Convolutions";Francois Chollet;《arXiv:1610.02357v3[cs.CV]》;20170404;论文第3-4节,图5 * |
"基于MobileNet-SSD的高铁隧道通信漏缆卡具检测";张云佐等;《新一代信息技术》;20200331;第3卷(第5期);论文第1节 * |
"特征增强SSD算法及其在遥感目标检测中的应用";史文旭等;《光子学报》;20200131;第49卷(第1期);论文第1.3节 * |
张云佐等."基于MobileNet-SSD的高铁隧道通信漏缆卡具检测".《新一代信息技术》.2020,第3卷(第5期), * |
Also Published As
Publication number | Publication date |
---|---|
CN112734732A (zh) | 2021-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112819804B (zh) | 一种基于改进YOLOv5卷积神经网络的绝缘子缺陷检测方法 | |
CN106595551B (zh) | 基于深度学习的输电线路覆冰图像中覆冰厚度检测方法 | |
CN111797890A (zh) | 一种用于检测输电线路设备缺陷的方法及系统 | |
CN103279765B (zh) | 基于图像匹配的钢丝绳表面损伤检测方法 | |
Yang et al. | Deep learning‐based bolt loosening detection for wind turbine towers | |
CN112734732B (zh) | 基于改进ssd算法的铁路隧道漏缆卡具检测方法 | |
CN112528979B (zh) | 变电站巡检机器人障碍物判别方法及系统 | |
CN110992349A (zh) | 一种基于深度学习的地下管道异常自动化定位与识别方法 | |
CN114973032B (zh) | 一种基于深度卷积神经网络的光伏板热斑检测方法及装置 | |
CN113252701B (zh) | 基于云边协同的输电线路绝缘子自爆缺陷检测系统及方法 | |
CN113469097B (zh) | 一种基于ssd网络的水面漂浮物多相机实时检测方法 | |
CN116503318A (zh) | 一种融合CAT-BiFPN与注意力机制的航拍绝缘子多缺陷检测方法、系统及设备 | |
CN109949209A (zh) | 一种基于深度学习的绳索检测与去除方法 | |
CN115620239B (zh) | 一种点云和视频结合的输电线路在线监测方法和系统 | |
CN113962973A (zh) | 一种基于卫星技术的输电线路无人机智能巡检系统及方法 | |
CN115240069A (zh) | 一种全雾天场景下的实时性障碍物检测方法 | |
CN113902792A (zh) | 基于改进RetinaNet网络的建筑物高度检测方法、系统和电子设备 | |
CN109934151B (zh) | 一种基于movidius计算芯片和Yolo face的人脸检测方法 | |
CN114241310B (zh) | 基于改进yolo模型的堤防管涌险情智能识别方法 | |
CN105528790A (zh) | 一种输电线路小型部件识别方法 | |
CN110163081A (zh) | 基于ssd的实时区域入侵检测方法、系统及存储介质 | |
CN115830302B (zh) | 一种多尺度特征提取融合配电网设备定位识别方法 | |
CN116129327A (zh) | 一种基于改进YOLOv7算法的红外车辆检测方法 | |
CN114187550A (zh) | 一种基于改进yolo v3网络的弓网核心零部件识别方法 | |
Shi et al. | An insulator detection model using bidirectional feature fusion structure based on yolo x |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |