CN108830331A - 一种基于全卷积网络的探地雷达目标检测方法 - Google Patents
一种基于全卷积网络的探地雷达目标检测方法 Download PDFInfo
- Publication number
- CN108830331A CN108830331A CN201810651121.0A CN201810651121A CN108830331A CN 108830331 A CN108830331 A CN 108830331A CN 201810651121 A CN201810651121 A CN 201810651121A CN 108830331 A CN108830331 A CN 108830331A
- Authority
- CN
- China
- Prior art keywords
- target
- ground penetrating
- penetrating radar
- full convolutional
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01V—GEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
- G01V3/00—Electric or magnetic prospecting or detecting; Measuring magnetic field characteristics of the earth, e.g. declination, deviation
- G01V3/12—Electric or magnetic prospecting or detecting; Measuring magnetic field characteristics of the earth, e.g. declination, deviation operating with electromagnetic waves
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Remote Sensing (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Geology (AREA)
- Environmental & Geological Engineering (AREA)
- Electromagnetism (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Geophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Radar Systems Or Details Thereof (AREA)
Abstract
本发明公开了一种基于全卷积网络的探地雷达目标检测方法,搭建一个三层的全卷积网络对探地雷达数据集进行训练,对图像进行缩放得到不同尺度,然后输入网络进行卷积运算,输出热度特征图,对该热度图进行映射计算后,定位目标的位置完成目标检测。本发明网络在训练时不需要使用有位置框标注的数据集,可以接受任意尺寸的输入图片,检测尺寸不一的目标,并且速度较快,在探地雷达数据量较少的情况下,通过数据扩充,实现了基于全卷积网络的探地雷达目标检测,该算法具有速度快、检测准确率高等优点。
Description
技术领域
本发明属于图像目标检测技术领域,具体涉及一种基于全卷积网络的探地雷达目标检测方法。
背景技术
探地雷达探地雷达(Ground Penetrating Radar,简称GPR)是利用电磁波探测地下目标,通过分析电磁信号与地下目标的相互作用,提取目标的性质、形状等信息。随着人类对自然界的逐渐了解和探索,人们对地表下世界的探知变得越来越迫切。探地雷达是近几年来应用于地表浅层地质构造、岩性检测的一项新技术,其特点是快速、无损、连续检测,并以实时成象方式显示地下结构剖面,使探测结果一目了然,分析、判读直观方便。因探测精度高、样点密、工作效率高而倍受一些行业的关注。随着该项技术的不断完善和发展,其应用领域不断扩展。比如城市道路病害检测,利用探地雷达检测生命体的准确位置给震后的救援工作提供极大便利等。
对于探地雷达目标检测任务来说,在实际的应用中处理技术仍然比较落后,最直观的表现就是自动化程度较低,仍然依赖操作人员的工程经验,而且对数据的解释能力较差,常常导致虚警。主要是因为地表的直达波有着很强的干扰性,使得感兴趣的目标被强杂波严重干扰;不同的天气和湿度下,相同的介质得到的雷达数据也会有很大的不同;目标环境的复杂性,使得先验知识很难得到,限制了很多需要先验的检测算法。因此检测准确率是探地雷达目标检的关键性问题。
传统的探地雷达目标检测,国内外学者也做了大量研究。传统的探地雷达目标检测算法大致可以分为以下两个研究方面。
(1)一种是通过对探地雷达图像的处理,利用目标体在探地雷达图像中的几何特征进行目标检测。一般利用Hough变换法提取目标反射双曲线特征,或者利用模式识别方式进行目标提取。Simi A等利用改进Hough变换和层析技术实现地下管线目标的自动检测,大大提高地下目标检测效率。Maas C等利用Hough变换提取双曲线特征,并用模式识别方法进行自动定位。
(2)一种是基于统计学原理对探地雷达信号进行建模,并进行假设检验,并计算检量,与固定或自适应门限进行比较,以判断目标有无。一种高阶方差分析结合序贯概率比检测的方法,以加窗的A-scan能量作为检验统计量进行地雷探测。一种是利用历史数据道的线性加权对当前道进行预测,并在频域利用子频带处理实现,成功地将目标从杂波背景中分离出来。在此基础上,通过实时更新参考信号,提出自适应单边线性预测算法,成功地解决检测器对地距离的变化所产生的影响;在单边预测的基础上,利用最大似然估计,完成了对不同环境中的地雷目标检测,但该算法需要大量无目标和杂波的参考信号,而参考信号常常混有杂波。应用恒虚警检测法(恒虚警率)进行地下异常检测,假设背景信号服从高斯分布,通过估计待测采样点附近背景信号的均值和标准差对信号进行归一化,然后沿深度方向计算置信度,与固定门限比较来确定目标有无。
以上传统的探地雷达目标检测方法中,第一类是基于图像级的目标检测,该方法将很大程度上和探地雷达图像的质量有很大的关系;第二类是利用对信号模型的假设检验来实现目标检测,这类方法将需要一定的先验知识,而且模型的正确与否会严重影响检测的正确率。
现在基于卷积网络的目标检测技术发展速度很快,而且速度和准确率都很高。所以一些研究学者开始致力于基于卷积网络的目标检测。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于全卷积网络的探地雷达目标检测方法,速度快、检测准确率高。
本发明采用以下技术方案:
一种基于全卷积网络的探地雷达目标检测方法,搭建一个三层的全卷积网络对探地雷达数据集进行训练,对图像进行缩放得到不同尺度,然后输入网络进行卷积运算,输出热度特征图,对该热度图进行映射计算后,定位目标的位置完成目标检测。
具体的,包括以下步骤:
S1、准备探地雷达数据集,准备相关正样本和负样本;
S2、设计全卷积网络,在样本上进行训练,得到一组对目标有极大响应的卷积核;
S3、利用准备好的数据集在该全卷积网络上进行训练;
S4、使用探地雷达图片进行图像缩放,形成图片金字塔输入全卷积网络进行检测,根据获得的热度图计算对应的目标框;
S5、目标框是密集响应,对同概率目标框进行位置平均,实现第一次筛选;
S6、采用非极大值抑制算法对目标框进行第二次筛选,得到最终检测结果。
进一步的,步骤S1中,正样本的选择与预处理如下:
在收集到的探地雷达频域图片中,在处理过杂波干扰后,保留能够看到目标的图片作为制作正样本的材料,使用重复多次截取正样本的策略,保证多次截取到的包含同一个目标的正样本之间具有差异性,做到对数据集正样本的扩充;
负样本的选取及预处理如下:
输入图片时,将图片上下四个边缘存在的坐标和柱体裁掉,只输入有目标的中间区域作为负样本,裁剪好的图片首先删掉包含了目标的图片,之后删除掉没有纹理的图片。
进一步的,步骤S2中,全卷积网络分为3层,第一层卷积层使用32个5×5的卷积核对60×60的图像进行卷积;第二层卷积层使用64个5×5的卷积核对上层的特征图进行卷积;前两个卷积层之后均接pooling层和ReLU层;第三层卷积层使用64个3×3的卷积核进行卷积,然后再接64个10×10的卷积核,对上一层的特征图进行卷积,得到一个1×1×2的输出向量,输出向量代表输入的60×60图像的分类结果。
进一步的,步骤S3中,在Windows下的caffe框架中对该网络进行训练,定义参数如下:base_lr为基础学习率,lr_policy为学习率改变方式,stepsize为学习率采用stepsize改变方式时改变的间隔,gamma为学习率变化比例,max_iter为训练过程总迭代次数,batch_size为训练时一次迭代输入图像数量,test_interval为测试验证集的迭代次数间隔,Test_batch_size为测试验证集时一次迭代输入图像数量,test_iter为测试验证集时需要迭代的次数;
使用step学习策略结合stepsize和gamma参数,得到学习率的变化公式,再引入epoch概念,一个epoch指训练过程中将全部训练图像训练了一遍的迭代次数,当训练经过一个epoch后进行验证集上的测试,batch_size越大,单次迭代输入的图像越多,训练的效果就越能拟合整个训练集上的数据分布。
进一步的,在训练时利用画出训练loss和accuracy的结果图判断网络是否训练到位和如何调整训练参数,从0.1开始,从大到小每次变化为之前的0.5倍,依次实验学习率变化后loss的变化情况,若loss很快向上升直到NAN,则学习太大;若loss下降剧烈后保持不变,说明学习率仍然有些高;接着再将学习率调小,若loss如直线一般下降,则说明学习率过小;通过观察训练loss下降的幅度找到合适的学习率,将网络训练完全。
更进一步的,学习率的变化公式为:
其中,base_lr为训练时的基础学习率,iter为当前迭代次数,stepsize为学习率改变间隔,为对进行向下取整。
进一步的,步骤S4中,根据热度图计算目标框的具体如下:
假设原图大小为m×n,整合后的热度图尺寸为M×N,热度图中的点(xi,yi)0<xi≤M,0<yi≤N,其对于目标类的概率值为pi,0≤pi≤1,所在的尺度为a,所在尺度的热度图原大小为Ma×Na;若该点的pi大于阈值γ,则认为该点对应目标框的框分类即为目标,得到一系列的候选目标框;
原图的左上角坐标(xiu,yiu):
原图的候选框宽高(w,h):
进一步的,步骤S5中,第一次筛选目标框具体如下:
首先将所有检测出的目标框放入候选组中,平均组为进行位置平均的目标框,经过平均后得到的是初筛框,如果两个概率相等的框的重叠面积超过90%,则认为这两个框需进行位置平均;经过初筛后,删除多余的目标框,筛除位置接近、检测概率相等的目标框。
进一步的,步骤S6中,第二次筛选目标框具体如下:
在得到初筛的框后,采取非最大值抑制法nms保留大概率的目标框,删除和大概率目标框重叠超过0.8的小概率目标框,同时确保不同的物体的目标框不被融合。
与现有技术相比,本发明至少具有以下有益效果:
本发明基于全卷积网络的探地雷达目标检测算法,搭建一个三层的全卷积网络对探地雷达数据集进行训练,对图像进行缩放得到不同尺度,然后输入网络进行卷积运算,输出热度特征图,对该热度图进行映射计算后,定位目标的位置完成目标检测。本方法网络很浅,只有三层结构,所以处理速度很快,且只要把数据集准备好,训练好网络,该方法可以达到非常好的检测效果,摆脱了以往的传统的探地雷达目标检测所存在的建模等弊端,学习到的特征更加鲁棒,检测准确率得到提升。
进一步的,利用卷积神经网络的方法进行目标检测,和以往传统的目标检测不同,初期需要准备大量的数据集用于训练网络,而且目前通用的数据集是没有现成的探地雷达相关数据集的,所以需要我们自己去准备数据集。准备一个数据量足够的高质量数据集才能让网络在样本数据集上通过训练学习到更加鲁棒的目标的特征,才能为基于全卷积网络的目标检测提供可能。
进一步的,目前基于卷积神经网络的目标检测是非常具有理论价值和应用价值的。所以我们考虑使用卷积神经网络的方法用于探地雷达的目标检测。但是网络的结构对结果的影响至关重要,需要设计一个比较好的网络框架。我们采用了一个仅有三层的全卷积网络用于目标检测,兼顾了速度和准确率。
进一步的,准备好数据集后,需要进行网络的训练,只有训练好网络才可以使用该网络用于后期的目标检测。对于网络的训练过程是需要进行反复实验,调整学习率等一系列参数然后才可以达到一个非常好的训练模型,后期的检测结果才会更加准确,训练出一个比较好的结果,才可能为后期的检测结果提供保障。
进一步的,一般来说,我们每一次训练完是需要一个标准去衡量我们的模型是否正确,网络是否训练的好,而学习率是最影响训练模型结果的,所以我们根据在训练时画出得训练loss和accuracy的结果图判断网络是否训练到位和如何调整训练参数,从0.1开始,从大到小每次变化为之前的0.5倍,依次实验学习率变化后loss的变化情况,通过观察训练loss下降的幅度找到合适的学习率,将网络训练完全。根据训练完的结果可以推测自己的网络训练参数是否合理,进一步修改参数,把网络训练到更好。
进一步的,因为我们进行目标检测时希望检测到不同尺寸的目标,所以在检测时我们需要进行图片的不同尺度的缩放,在各个不同的尺度下去输入网络,在得到的热度图中,只有在某个尺度下目标正好缩放到60*60时,这个目标的响应最大,就可以检测到目标。检测到的目标是需要计算出目标框的,所以利用权利要求8中的公式进行计算目标框,得到目标的位置信息。
进一步的,由于该网络对原图的响应是密集响应,即存在许多位置近似,甚至检测概率相等的大量的冗余框,如果简单地将多余的框删除,可能会导致定位不准确,所以我们需要对冗余框的位置进行整合。在整合过程中我们分了两次进行整合,第一次筛选目标框是把概率相等的目标框进行位置平均。这其中要把目标框的重合度作为参考标准,重合过少的目标框即便概率相等也不能删除,因为这样的目标框有可能属于不同的目标框。
进一步的,经过第一次筛选目标框之后,已经筛选掉了大部分的目标框,但是仍然存在位置接近概率不同的目标框,这时我们需要保留概率最大的目标框,把同一目标的其余的小概率目标框删除,这样就可以保证每一个目标只留下一个目标框,这其中要把目标框的重合度作为参考标准,重合过少的目标框即便概率相等也不能删除,因为这样的目标框有可能属于不同的目标框。得到最终的检测结果。
综上所述,本发明不同于经典的卷积网络在卷积层后使用全连接层,全卷积网络将全连接层换成卷积层,输出分类结果是一张热度特征图,热度特征图中每一个像素对应着原图中一个区域的分类,该网络在训练时不需要使用有位置框标注的数据集,可以接受任意尺寸的输入图片,检测尺寸不一的目标,并且速度较快,在探地雷达数据量较少的情况下,通过数据扩充,实现了基于全卷积网络的探地雷达目标检测,该算法具有速度快、检测准确率高等优点。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明流程示意图;
图2为本发明网络框架;
图3为本发明第一次筛选目标框流程;
图4为本发明第二次筛选目标框流程;
图5为本发明含有同一目标的不同正样本,其中,(a)为106×100的正样本,(b)为128×110的正样本,(c)为170×125的正样本;
图6为本发明部分负样本示例,其中,(a)为负样本示例1,(b)为负样本示例2,(c)为负样本示例3,(d)为负样本示例4;
图7为本发明训练时的损失函数曲线;
图8为本发明测试时的损失函数曲线;
图9为本发明测试时的准确率曲线;
图10为本发明一种结果展示,其中,(a)为原始图片,(b)为阈值设置为3时,恒虚警的实验结果,(c)为阈值设置为4时,恒虚警的实验结果,(d)为基于全卷积网络的检测结果;
图11为本发明第二种结果展示,其中,(a)为原始图片,(b)为阈值设置为3时,恒虚警的实验结果,(c)为阈值设置为4时,恒虚警的实验结果,(d)为基于全卷积网络的检测结果。
具体实施方式
本发明提供了一种基于全卷积网络的探地雷达目标检测方法,不同于经典的卷积网络在卷积层后使用全连接层,全卷积网络将全连接层换成卷积层,输出分类结果是一张热度特征图,热度特征图中每一个像素对应着原图中一个区域的分类。利用此特性,搭建了一个三层的全卷积网络。检测阶段首先对图像进行缩放到不同尺度,然后输入网络进行卷积运算,输出热度特征图,对该热度图进行映射计算后,可以准确定位目标的位置。该网络在训练时不需要使用有位置框标注的数据集,可以接受任意尺寸的输入图片,检测尺寸不一的目标,并且速度较快。
在探地雷达数据量较少的情况下,通过数据扩充,实现了基于全卷积网络的探地雷达目标检测,该算法具有速度快、检测准确率高等优点。
请参阅图1,本发明一种基于全卷积网络的探地雷达目标检测方法,包括以下步骤:
S1、准备探地雷达数据集,准备相关正样本和负样本;
对于准备数据集的实施方法为:
在许多探地雷达检测的图像中,目标会出现各种情况的杂波干扰,所以选择正、负样本进行训练,并排除这些因素的干扰,是需要解决的重要问题。
正样本的选择与预处理
在收集到的探地雷达的频域图片中,在处理过一些杂波干扰后,有些干扰还是太大,以至于无法进行探地雷达目标检测,需要把这些图片剔除,挑选出一些干扰性不是很大的图片,可以适合作为探地雷达的目标检测的图片即保留能够看到目标的图片作为制作正样本的材料。
如果正样本中包含一些不属于目标的物体,训练时网络也会提取该物体的特征,那么在检测时,如果这个物体作为一个单独物体出现,网络会对它有较强的响应,造成误检。
制作正样本。所以为了解决数据集数量过少的问题,本实验使用了重复多次截取正样本的策略,由于探地雷达的目标非常小,在截取出的正样本中背景还是会占到不小的比例,这个时候采取重复多次截取的策略,就可以保证多次截取到的包含同一个目标的正样本之间是有一定差异性的,这种做法可以做到对数据集正样本的扩充。
负样本的选取及预处理
负样本需要考虑到所有的情况,包含的物体、纹理种类必须要全面。如果某类物体没有出现在正样本和负样本中,那么在测试阶段时,很有可能会将它作为正样本被检测出来。如果某物体的纹理较深的话,它的响应会比较大,从而在滤波后会在热度图上会保留下来。考虑到探地雷达图像中的实际情况,图片背景相对之前的车辆数据集比较简单一些,很大部分的背景都是接近纯蓝色的背景和有比较多白色杂点的背景的淡蓝色背景。因为其上下四个边缘存在的坐标和柱体,这些背景纹理比较明显,很容易被错检为目标,为了防止干扰,所以输入图片时,把这些地方裁掉,只输入由目标的中间区域,因此这些背景没有当做负样本。
对于探地雷达图片比较少的情形,像之前使用固定窗口的滑窗在图片上截取负样本的策略,并进行筛选。由于这是没有标注的图片,所以裁剪好的图片首先需要删掉包含了目标的图片,之后删除掉基本没有纹理的图片,比如周围边缘的纯白图片,还有很纯净的纯蓝色的图片。
S2、设计全卷积网络,在样本上进行训练。得到一组对目标有极大响应的卷积核;
对于设计的全卷积网络为:
全卷积网络分为3层,第一层卷积层使用32个5×5的卷积核对60×60的图像进行卷积。第二层卷积层使用64个5×5的卷积核对上层的特征图进行卷积。前两个卷积层之后都接了pooling层和ReLU层。第三层卷积层使用64个3×3的卷积核进行卷积,然后再接64个10×10的卷积核,对上一层的特征图进行卷积,得到一个1×1×2的输出向量。这个向量代表输入的60×60的图像的分类结果。
请参阅图2,全卷积网络相当于训练了一组卷积核,该组卷积核不论对多大的图片进行卷积,都是以60×60的滑窗对图像进行分析,并得出每个滑窗相对应的分类结果。所以在测试时,可以不考虑输入的大小。该图片经过这组卷积核后的响应图上的每一个点,实际上是输入图像中以步长为4的60×60的图像块针对卷积核的响应,也就是该60×60的图像块的分类概率。
S3、利用准备好的数据集在该全卷积网络上进行训练;
对于网络的训练过程为:
在Windows下的caffe框架中对该网络进行训练。训练时需要设置的参数如下表所示:
表1训练网络的solver文件
其中base_lr是训练时的基础学习率,也是影响训练效果的主要参数,通过调节这个参数来判断网络是否训练到位。学习率是应该随着迭代次数减小的,lr_policy就是学习率的变化方式,caffe中支持四种学习策略fixed,step,inv,multistep,使用step策略,而结合stepsize和gamma两个参数,学习率的变化公式为:
再引入epoch的概念,一个epoch指训练过程中将全部训练图像训练了一遍的迭代次数,这个值是和batch_size以及总图像数量计算的,由于每次训练迭代都只用到了batch_size数量的图像,训练出的网络结果是符合这些图像的而不是整个训练集的结果,可以预见到的是,batch_size越大,单次迭代输入的图像越多,训练的效果就越能拟合整个训练集上的数据分布,当然相应的会使用较大的存储和计算量。而一般当训练经过一个epoch后进行验证集上的测试是比较合理的。
值得注意的是,测试时的test_batch_size大小并不影响测试时的准确度,也不影响网络参数,因此设置较小是基于节省存储空间的考虑。
在训练时利用画出训练loss和accuracy的结果图来判断网络是否训练到位和如何调整训练参数。一般从0.1开始,从大到小每次变化为之前的0.5倍,依次实验学习率变化后loss的变化情况,用以找到合适的学习率。若发现loss很快向上升知道NAN了,一般是因为学习太大了,也就是对应黄线的情况;若发现loss下降的很剧烈,但很快就保持不变了,那说明学习率仍然有些高;接着再将学习率调小,若发现loss如直线一般的下降,则说明是学习率过小了;这时合适的学习率所产生的loss变化应该是上两者之间的,先剧烈下降,再缓慢下降的情况,对应的是红色的情况。因此可以通过观察训练loss下降的幅度来找到合适的学习率,将网络训练完全。
S4、使用探地雷达图片进行图像缩放,形成图片金字塔输入全卷积网络进行检测,根据获得的热度图计算对应的目标框;
对于根据热度图计算目标框的实施方法为:
假设原图大小为m×n,整合后的热度图的尺寸为M×N(即最大热度图尺寸),热度图中的点(xi,yi)(0<xi≤M,0<yi≤N),其对于目标类的概率值为pi,(0≤pi≤1),所在的尺度为a,所在尺度的热度图原大小为Ma×Na;则若该点的pi大于阈值γ,则认为其对应的目标框框分类即为目标;则该点对应的目标框的计算公式为:
原图的左上角坐标(xiu,yiu):
原图的候选框宽高(w,h):
得到一系列的候选目标框。从目标框的生成公式可知,对于不同的尺度,生成的目标框的大小不同;对于大的尺度,卷积核相当于原图就较小,感受也较小,生成的目标框也较小;对于小的尺度,卷积核相当于原图就较大,感受也较大,生成的目标框也较大。
S5、目标框是密集响应,对同概率目标框进行位置平均,实现第一次筛选;
请参阅图3,对于第一次筛选目标框的实施方法为:
由于该网络对原图的响应是密集响应,许多目标框为冗余框,它们位置近似,但是检测概率相等,如果简单地将多余的框删除,可能会导致定位不准确,所以我们需要对冗余框的位置进行整合,具体如下:
首先将所有的检测出的目标框放入候选组中,平均组则为需要进行位置平均的目标框。经过平均后得到的是初筛框。在算法中,如果两个概率相等的框的重叠面积超过90%,则认为这两个框需要进行位置平均。
经过初筛后,目标框数量会减少,多余的目标框删除了;对于位置接近,检测概率相等的目标框都进行了筛除,使得检测的定位更加准确,也会减少后面nms算法的计算时间。这一操作可以筛除60%以上的目标框。
S6、采用非极大值抑制算法对目标框进行第二次筛选,得到最终检测结果。
请参阅图4,对于第二次筛选目标框的实施方法为:
在得到初筛的框后,采取非最大值抑制法nms(non maximum suppression)来保留大概率的目标框,从而删除和大概率目标框重叠超过0.8的小概率目标框,同时确保了不同的物体的目标框不会被融合。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中的描述和所示的本发明实施例的组件可以通过各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的技术思路如下:本算法分为训练阶段和检测阶段。算法的核心是对检测图片进行缩放操作,并使用网络对多个尺度下的图片进行卷积操作,使得各个尺度的图片都有与目标尺寸相匹配的滑动窗口,这样网络计算出的特征对于该滑动窗口的响应最大。由此可以判定目标的位置。
在训练阶段,首先我们是需要准备一个数据集,这个数据集包含正样本和负样本,一般我们按照1:3的数据量来准备。其中正样本是只有探地雷达的目标图片,如图5所示,负样本是包括了所有可能出现在探地雷达图片中的背景图片块组成,如图6所示。
整合了2400张数据集,其中正样本600张,负样本1800张。数据量基本可以支撑我们训练出一个性能优越的全卷积网络。
然后通过一个精简的全卷积网络,在样本上进行训练,得到一组对目标有极大响应的卷积核。
在Windows下的caffe框架中对该网络进行训练。训练时的参数如下表2所示:
表2实际训练网络的solver文件
以上参数中,初始学习率设置为0.0009。根据迭代次数对学习率进行改变,每迭代300次对学习率进行一次改变,改变为0.1倍。每迭代100次对测试集进行测试。权重衰减是防止权值变化太快而导致过拟合。动量项是在保证权值改变量稳定的情况下尽可能加快速度。
训练集为2200张,其中550为雷达目标正样本,1650张为负样本。测试集数量为200张,其中50张正样本,150张为负样本。训练时每批图像的数量为128,对网络进行10000次迭代训练。训练时使用了型号为GTX 980Ti的GPU。
请参阅图7和图8,Iters代表迭代次数,可以看出,网络收敛很快。在迭代800次时,测试集的损失值已经基本平稳。而训练集的损失函数也在迭代800次左右时已经基本平稳。
网络在测试集上的准确率也很快达到了97%以上。测试集准确率曲线如下图9所示。
在检测阶段,首先将图片缩放至不同尺寸,以便图片中的所有目标都会有匹配训练样本大小相近的尺寸的情况。然后使用该组卷积核对整张图进行卷积,得到整张图对该组卷积核的响应,将这几张不同尺度下的响应图进行整合,从而确定目标的位置。然后通过网络的尺寸确定目标框大小,并得到所有的候选目标框。
由于热度图的每个点是对原图的密集响应的结果,所以需要对候选的目标框进行筛选。首先对位置重叠率大于90%的目标框进行位置平均,然后采用非极大值抑制算法进一步筛选,得到最后的目标位置。
使用基于全卷积网络的探地雷达目标检测算法在50张探地雷达数据上进行了检测。这50张探地雷达图片,是目标没有被杂波彻底掩盖,仍可以人眼分辨出目标所在位置,有杂波干扰比较大的图片,也有相对来说,杂波干扰比较小的图片,涵盖了比较全面的探地雷达目标检测的很多情况。
使用的对比方法为传统的基于恒虚警的探地雷达目标检测算法。该算法是传统的探地雷达检测算法,具有比较好的检测准确率和速度。所以我选择这两个算法作为比较算法。
cn_detection是本文提出的基于全卷积网络的探地雷达目标检测算法。在进行检测时,由于测试数据集大小为1200×900,其中的目标的大小都很小,而且只要检测到目标的质心位置即可。所以设定的缩放尺度为1个尺度:1.0,即不对图片进行缩放,所以每张图片的处理速度很快。目标判定阈值设置为0.8,nms阈值设定为0.7。运行算法的GPU为GTX980 Ti,CPU主频为2.8GHz。其统计结果如下表3所示。
表3数据集检测结果
检测准确率上,恒虚警只有在干扰很小的时候,才可以比较准确的测出目标所在位置,而且非常依赖于阈值的选取,如图10和11所示。当干扰比较大的时候,恒虚警检测结果会大面积出现虚假目标点,如图10,11所示。所以基于恒虚警的探地雷达目标检测存在大量的错检情况。但是利用全卷积网络,错检和漏检的情况都有改善。在速度上,基于全卷积网络的速度可以达到124ms/张,基于恒虚警的检测算法速度为236ms/张。基于全卷积网络的检测速度还是高于基于恒虚警的检测速度。
请参阅图10,图(a)为原始图片,图(b)为阈值设置为3时,恒虚警的实验结果。图(c)为阈值设置为4时,恒虚警的实验结果,图(d)为基于全卷积网络的检测结果。
请参阅图11,图(a)为原始图片,图(b)为阈值设置为3时,恒虚警的实验结果。图(c)为阈值设置为4时,恒虚警的实验结果,图(d)为基于全卷积网络的检测结果。
基于恒虚警的目标检测算法,在存在干扰比较大的情况下,会有很多的错检和漏检。基于全卷积的探地雷达目标检测处理速度很快,而且该算法只要训练的网络好,检测准确率很高,超过基于恒虚警的目标检测算法。
以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。
Claims (10)
1.一种基于全卷积网络的探地雷达目标检测方法,其特征在于,搭建一个三层的全卷积网络对探地雷达数据集进行训练,对图像进行缩放得到不同尺度,然后输入网络进行卷积运算,输出热度特征图,对该热度图进行映射计算后,定位目标的位置完成目标检测。
2.根据权利要求1所述的一种基于全卷积网络的探地雷达目标检测方法,其特征在于,包括以下步骤:
S1、准备探地雷达数据集,准备相关正样本和负样本;
S2、设计全卷积网络,在样本上进行训练,得到一组对目标有极大响应的卷积核;
S3、利用准备好的数据集在该全卷积网络上进行训练;
S4、使用探地雷达图片进行图像缩放,形成图片金字塔输入全卷积网络进行检测,根据获得的热度图计算对应的目标框;
S5、目标框是密集响应,对同概率目标框进行位置平均,实现第一次筛选;
S6、采用非极大值抑制算法对目标框进行第二次筛选,得到最终检测结果。
3.根据权利要求2所述的一种基于全卷积网络的探地雷达目标检测方法,其特征在于,步骤S1中,正样本的选择与预处理如下:
在收集到的探地雷达频域图片中,在处理过杂波干扰后,保留能够看到目标的图片作为制作正样本的材料,使用重复多次截取正样本的策略,保证多次截取到的包含同一个目标的正样本之间具有差异性,做到对数据集正样本的扩充;
负样本的选取及预处理如下:
输入图片时,将图片上下四个边缘存在的坐标和柱体裁掉,只输入有目标的中间区域作为负样本,裁剪好的图片首先删掉包含了目标的图片,之后删除掉没有纹理的图片。
4.根据权利要求2所述的一种基于全卷积网络的探地雷达目标检测方法,其特征在于,步骤S2中,全卷积网络分为3层,第一层卷积层使用32个5×5的卷积核对60×60的图像进行卷积;第二层卷积层使用64个5×5的卷积核对上层的特征图进行卷积;前两个卷积层之后均接pooling层和ReLU层;第三层卷积层使用64个3×3的卷积核进行卷积,然后再接64个10×10的卷积核,对上一层的特征图进行卷积,得到一个1×1×2的输出向量,输出向量代表输入的60×60图像的分类结果。
5.根据权利要求2所述的一种基于全卷积网络的探地雷达目标检测方法,其特征在于,步骤S3中,在Windows下的caffe框架中对该网络进行训练,定义参数如下:base_lr为基础学习率,lr_policy为学习率改变方式,stepsize为学习率采用stepsize改变方式时改变的间隔,gamma为学习率变化比例,max_iter为训练过程总迭代次数,batch_size为训练时一次迭代输入图像数量,test_interval为测试验证集的迭代次数间隔,Test_batch_size为测试验证集时一次迭代输入图像数量,test_iter为测试验证集时需要迭代的次数;
使用step学习策略结合stepsize和gamma参数,得到学习率的变化公式,再引入epoch概念,一个epoch指训练过程中将全部训练图像训练了一遍的迭代次数,当训练经过一个epoch后进行验证集上的测试,batch_size越大,单次迭代输入的图像越多,训练的效果就越能拟合整个训练集上的数据分布。
6.根据权利要求5所述的一种基于全卷积网络的探地雷达目标检测方法,其特征在于,在训练时利用画出训练loss和accuracy的结果图判断网络是否训练到位和如何调整训练参数,从0.1开始,从大到小每次变化为之前的0.5倍,依次实验学习率变化后loss的变化情况,若loss很快向上升直到NAN,则学习太大;若loss下降剧烈后保持不变,说明学习率仍然高;接着再将学习率调小,若loss如直线一般下降,则说明学习率过小;通过观察训练loss下降的幅度找到合适的学习率,将网络训练完全。
7.根据权利要求6所述的一种基于全卷积网络的探地雷达目标检测方法,其特征在于,学习率的变化公式为:
其中,base_lr为训练时的基础学习率,iter为当前迭代次数,stepsize为学习率改变间隔,为对进行向下取整。
8.根据权利要求2所述的一种基于全卷积网络的探地雷达目标检测方法,其特征在于,步骤S4中,根据热度图计算目标框的具体如下:
假设原图大小为m×n,整合后的热度图尺寸为M×N,热度图中的点(xi,yi)0<xi≤M,0<yi≤N,其对于目标类的概率值为pi,0≤pi≤1,所在的尺度为a,所在尺度的热度图原大小为Ma×Na;若该点的pi大于阈值γ,则该点对应目标框的框分类为目标,得到一系列的候选目标框;
原图的左上角坐标(xiu,yiu):
原图的候选框宽高(w,h):
9.根据权利要求2所述的一种基于全卷积网络的探地雷达目标检测方法,其特征在于,步骤S5中,第一次筛选目标框具体如下:
首先将所有检测出的目标框放入候选组中,平均组为进行位置平均的目标框,经过平均后得到初筛框,如果两个概率相等的框的重叠面积超过90%,则这两个框需进行位置平均;经过初筛后,删除多余的目标框,筛除位置接近、检测概率相等的目标框。
10.根据权利要求2所述的一种基于全卷积网络的探地雷达目标检测方法,其特征在于,步骤S6中,第二次筛选目标框具体如下:
在得到初筛的框后,采取非最大值抑制法nms保留大概率的目标框,删除和大概率目标框重叠超过0.8的小概率目标框,同时确保不同的物体的目标框不被融合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810651121.0A CN108830331A (zh) | 2018-06-22 | 2018-06-22 | 一种基于全卷积网络的探地雷达目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810651121.0A CN108830331A (zh) | 2018-06-22 | 2018-06-22 | 一种基于全卷积网络的探地雷达目标检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108830331A true CN108830331A (zh) | 2018-11-16 |
Family
ID=64137462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810651121.0A Pending CN108830331A (zh) | 2018-06-22 | 2018-06-22 | 一种基于全卷积网络的探地雷达目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108830331A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109559300A (zh) * | 2018-11-19 | 2019-04-02 | 上海商汤智能科技有限公司 | 图像处理方法、电子设备及计算机可读存储介质 |
CN109669184A (zh) * | 2019-02-25 | 2019-04-23 | 电子科技大学 | 一种基于全卷积网络的合成孔径雷达方位模糊消除方法 |
CN110133643A (zh) * | 2019-05-22 | 2019-08-16 | 北京林业大学 | 植物根系探测方法及装置 |
CN110146855A (zh) * | 2019-06-11 | 2019-08-20 | 北京无线电测量研究所 | 雷达间断干扰抑制门限计算方法及装置 |
CN110716199A (zh) * | 2019-09-18 | 2020-01-21 | 武汉市工程科学技术研究院 | 用于计算机自动辨别多类型缺陷的地质雷达标记方法 |
CN111323764A (zh) * | 2020-01-21 | 2020-06-23 | 山东大学 | 一种基于探地雷达的地下工程目标体智能识别方法及系统 |
CN112085185A (zh) * | 2019-06-12 | 2020-12-15 | 上海寒武纪信息科技有限公司 | 量化参数调整方法、装置及相关产品 |
CN112465023A (zh) * | 2020-11-27 | 2021-03-09 | 自然资源部第一海洋研究所 | 一种地质方向人工神经网络训练数据的扩展算法 |
CN112462346A (zh) * | 2020-11-26 | 2021-03-09 | 西安交通大学 | 一种基于卷积神经网络的探地雷达路基病害目标检测方法 |
US11107297B2 (en) * | 2018-12-12 | 2021-08-31 | Simmonds Precision Products, Inc. | Merging discrete time signals |
CN113408366A (zh) * | 2021-05-27 | 2021-09-17 | 中山大学 | 一种低频超宽带合成孔径雷达图像叶簇覆盖目标检测方法 |
CN114707532A (zh) * | 2022-01-11 | 2022-07-05 | 中铁隧道局集团有限公司 | 一种基于改进的Cascade R-CNN的探地雷达隧道病害目标检测方法 |
CN116256701A (zh) * | 2023-05-16 | 2023-06-13 | 中南大学 | 一种基于深度学习的探地雷达互扰波抑制方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080079723A1 (en) * | 2006-05-16 | 2008-04-03 | David Hanson | System and method for visualizing multiple-sensor subsurface imaging data |
CN103837872A (zh) * | 2012-11-22 | 2014-06-04 | 株式会社电装 | 目标检测装置 |
CN106651955A (zh) * | 2016-10-10 | 2017-05-10 | 北京小米移动软件有限公司 | 图片中目标物的定位方法及装置 |
CN107229918A (zh) * | 2017-05-26 | 2017-10-03 | 西安电子科技大学 | 一种基于全卷积神经网络的sar图像目标检测方法 |
CN107944437A (zh) * | 2017-12-31 | 2018-04-20 | 广州二元科技有限公司 | 一种基于神经网络和积分图像的人脸定位方法 |
CN108182450A (zh) * | 2017-12-25 | 2018-06-19 | 电子科技大学 | 一种基于深度卷积网络的机载探地雷达目标识别方法 |
-
2018
- 2018-06-22 CN CN201810651121.0A patent/CN108830331A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080079723A1 (en) * | 2006-05-16 | 2008-04-03 | David Hanson | System and method for visualizing multiple-sensor subsurface imaging data |
CN103837872A (zh) * | 2012-11-22 | 2014-06-04 | 株式会社电装 | 目标检测装置 |
CN106651955A (zh) * | 2016-10-10 | 2017-05-10 | 北京小米移动软件有限公司 | 图片中目标物的定位方法及装置 |
CN107229918A (zh) * | 2017-05-26 | 2017-10-03 | 西安电子科技大学 | 一种基于全卷积神经网络的sar图像目标检测方法 |
CN108182450A (zh) * | 2017-12-25 | 2018-06-19 | 电子科技大学 | 一种基于深度卷积网络的机载探地雷达目标识别方法 |
CN107944437A (zh) * | 2017-12-31 | 2018-04-20 | 广州二元科技有限公司 | 一种基于神经网络和积分图像的人脸定位方法 |
Non-Patent Citations (3)
Title |
---|
DANIËL REICHMAN ET AL.: "Some good practices for applying convolutional neural networks to buried threat detection in Ground Penetrating Radar", 《2017 9TH INTERNATIONAL WORKSHOP ON ADVANCED GROUND PENETRATING RADAR (IWAGPR)》 * |
公安部第三研究所 著: "《多摄像机协同关注目标检测跟踪技术》", 30 June 2017, 东南大学出版社 * |
黄孝平 著: "《当代机器深度学习方法与应用研究》", 30 November 2017, 电子科技大学出版社 * |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109559300A (zh) * | 2018-11-19 | 2019-04-02 | 上海商汤智能科技有限公司 | 图像处理方法、电子设备及计算机可读存储介质 |
US11107297B2 (en) * | 2018-12-12 | 2021-08-31 | Simmonds Precision Products, Inc. | Merging discrete time signals |
CN109669184A (zh) * | 2019-02-25 | 2019-04-23 | 电子科技大学 | 一种基于全卷积网络的合成孔径雷达方位模糊消除方法 |
CN109669184B (zh) * | 2019-02-25 | 2021-04-20 | 电子科技大学 | 一种基于全卷积网络的合成孔径雷达方位模糊消除方法 |
CN110133643A (zh) * | 2019-05-22 | 2019-08-16 | 北京林业大学 | 植物根系探测方法及装置 |
CN110133643B (zh) * | 2019-05-22 | 2021-08-20 | 北京林业大学 | 植物根系探测方法及装置 |
CN110146855A (zh) * | 2019-06-11 | 2019-08-20 | 北京无线电测量研究所 | 雷达间断干扰抑制门限计算方法及装置 |
CN110146855B (zh) * | 2019-06-11 | 2020-10-23 | 北京无线电测量研究所 | 雷达间断干扰抑制门限计算方法及装置 |
CN112085185A (zh) * | 2019-06-12 | 2020-12-15 | 上海寒武纪信息科技有限公司 | 量化参数调整方法、装置及相关产品 |
CN112085185B (zh) * | 2019-06-12 | 2024-04-02 | 上海寒武纪信息科技有限公司 | 量化参数调整方法、装置及相关产品 |
CN110716199A (zh) * | 2019-09-18 | 2020-01-21 | 武汉市工程科学技术研究院 | 用于计算机自动辨别多类型缺陷的地质雷达标记方法 |
CN110716199B (zh) * | 2019-09-18 | 2023-09-29 | 武汉市工程科学技术研究院 | 用于计算机自动辨别多类型缺陷的地质雷达标记方法 |
CN111323764A (zh) * | 2020-01-21 | 2020-06-23 | 山东大学 | 一种基于探地雷达的地下工程目标体智能识别方法及系统 |
CN111323764B (zh) * | 2020-01-21 | 2022-03-25 | 山东大学 | 一种基于探地雷达的地下工程目标体智能识别方法及系统 |
CN112462346B (zh) * | 2020-11-26 | 2023-04-28 | 西安交通大学 | 一种基于卷积神经网络的探地雷达路基病害目标检测方法 |
CN112462346A (zh) * | 2020-11-26 | 2021-03-09 | 西安交通大学 | 一种基于卷积神经网络的探地雷达路基病害目标检测方法 |
CN112465023A (zh) * | 2020-11-27 | 2021-03-09 | 自然资源部第一海洋研究所 | 一种地质方向人工神经网络训练数据的扩展算法 |
CN113408366A (zh) * | 2021-05-27 | 2021-09-17 | 中山大学 | 一种低频超宽带合成孔径雷达图像叶簇覆盖目标检测方法 |
CN113408366B (zh) * | 2021-05-27 | 2024-02-20 | 中山大学 | 一种低频超宽带合成孔径雷达图像叶簇覆盖目标检测方法 |
CN114707532A (zh) * | 2022-01-11 | 2022-07-05 | 中铁隧道局集团有限公司 | 一种基于改进的Cascade R-CNN的探地雷达隧道病害目标检测方法 |
CN116256701A (zh) * | 2023-05-16 | 2023-06-13 | 中南大学 | 一种基于深度学习的探地雷达互扰波抑制方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108830331A (zh) | 一种基于全卷积网络的探地雷达目标检测方法 | |
Liu et al. | Detection and localization of rebar in concrete by deep learning using ground penetrating radar | |
Lechner et al. | Remote sensing of small and linear features: Quantifying the effects of patch size and length, grid position and detectability on land cover mapping | |
Huang et al. | A new building extraction postprocessing framework for high-spatial-resolution remote-sensing imagery | |
Berberoglu et al. | The integration of spectral and textural information using neural networks for land cover mapping in the Mediterranean | |
CN104376330B (zh) | 基于超像素散射机制的极化sar图像舰船目标检测方法 | |
CN105528619B (zh) | 基于小波变换和svm的sar遥感影像变化检测方法 | |
CN107274416B (zh) | 基于光谱梯度与层次结构的高光谱图像显著性目标检测方法 | |
CN105787937B (zh) | 一种基于osm的高分辨遥感影像道路变化检测方法 | |
CN108960198A (zh) | 一种基于残差ssd模型的交通标志检测与识别方法 | |
CN104680542B (zh) | 基于在线学习的遥感影像变化检测方法 | |
Wang et al. | The role of spatial heterogeneity in detecting urban slums | |
CN109409190A (zh) | 基于梯度直方图和Canny边缘检测器的行人检测方法 | |
CN104361582B (zh) | 一种对象级高分辨率sar影像洪水灾害变化检测方法 | |
CN107507170A (zh) | 一种基于多尺度图像信息融合的机场跑道裂缝检测方法 | |
CN110502654A (zh) | 一种适用于多源异构遥感数据的目标库生成系统 | |
CN108447055A (zh) | 基于spl和ccn的sar图像变化检测方法 | |
CN105160648B (zh) | 基于小波和恒虚警率的雷达目标及阴影分割方法 | |
CN108564085A (zh) | 一种自动读取指针式仪表读数的方法 | |
CN106408030A (zh) | 基于中层语义属性和卷积神经网络的sar图像分类方法 | |
CN108154159A (zh) | 一种基于多级检测器的具有自恢复能力的目标跟踪方法 | |
CN110110675A (zh) | 一种融合边缘信息的小波域分形红外卷云检测方法 | |
CN108280412A (zh) | 基于变结构cnn的高分辨sar图像目标检测方法 | |
CN110298410A (zh) | 基于深度学习的低对比度图像中弱目标检测方法及装置 | |
Lambers et al. | Towards detection of archaeological objects in high-resolution remotely sensed images: the Silvretta case study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181116 |