CN116071307A - 路面缺陷检测模型建立方法、检测方法、存储介质及设备 - Google Patents
路面缺陷检测模型建立方法、检测方法、存储介质及设备 Download PDFInfo
- Publication number
- CN116071307A CN116071307A CN202211675037.5A CN202211675037A CN116071307A CN 116071307 A CN116071307 A CN 116071307A CN 202211675037 A CN202211675037 A CN 202211675037A CN 116071307 A CN116071307 A CN 116071307A
- Authority
- CN
- China
- Prior art keywords
- disease
- data set
- image
- pavement
- defect detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 56
- 230000007547 defect Effects 0.000 title claims abstract description 39
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000003860 storage Methods 0.000 title claims abstract description 9
- 201000010099 disease Diseases 0.000 claims abstract description 62
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 62
- 238000012549 training Methods 0.000 claims abstract description 24
- 230000006870 function Effects 0.000 claims description 19
- 238000010586 diagram Methods 0.000 claims description 18
- 230000004913 activation Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 239000013598 vector Substances 0.000 claims description 9
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 5
- 239000010426 asphalt Substances 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 238000012886 linear function Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 239000004568 cement Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000004579 marble Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 101100406366 Caenorhabditis elegans pad-2 gene Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013434 data augmentation Methods 0.000 description 1
- 230000009429 distress Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
- G06T5/92—Dynamic range modification of images or parts thereof based on global image properties
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30181—Earth observation
- G06T2207/30184—Infrastructure
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Processing (AREA)
Abstract
本发明涉及路面缺陷检测模型建立方法、检测方法、存储介质及设备,模型建立方法包括S1、获取原始数据集;S2、通过CycleGan网络将原始数据集中的图像转换为其他类型路面的正常图像,得到增强正常数据集;S3、对原始数据集的病害图像打标签,然后通过Scharr滤波器求解打上标签的病害图像,得到特征明显的病害图;S4、将特征明显的病害图上的病害特征裁剪下来,并添加至增强正常数据集上,得到增强病害数据集;S5、将原始数据集与增强病害数据集结合,输入训练模型进行训练,得到路面缺陷检测模型。本发明能够得到不同类型路面的数据集,从而增加数据集,并且对病害图片的预处理能够使得病害特征更加明显,提高检测的准确性。
Description
技术领域
本发明属于路面检测技术领域,尤其是一种路面缺陷检测模型建立方法、检测方法、存储介质及设备。
背景技术
公路路面常出现裂纹、坑槽等缺陷,这些缺陷会影响行车安全,因此,需要及时对受损的路面进行处理,而及时处理的前提是能够及时、准确地识别出路面缺陷。
目前,图像识别是路面缺陷检测的重要手段,CN202111458712公开了一种路面缺陷损伤实时监测方法及系统,包括获取道路图形数据,预处理,数据增强,构建训练模型,训练等步骤,其中,图像增强技术采用放射变换,并不能得到不同类型路面的数据集。
CN113592784A公开了一种基于Yolo V5的多阈值半监督道路异常病害智能检测方法,包括收集路面异常病害图像,组成教师样本集,并对教师样本集进行预处理,得到初始训练数据集;训练Yolo V5目标检测网络,得到初始教师模型;进一步收集真实场景路面图像数据,基于多阈值方式,形成学生样本集;将教师样本集进行强数据增强、学生样本集进行弱数据增强,在初始教师模型的基础上进行模型的训练,得到进化教师模型;持续收集真实场景路面图像数据,不断优化进化教师模型,最终得到目标路面病害识别检测网络;进行道路异常病害智能检测。其图像增强为:对图像进行水平翻转、90度、270度旋转、整数平移和直方图均衡化操作,得到增广后的教师样本集数据,也不能得到不同类型路面的数据集。
CN115187583A公开了一种基于改进YOLOv5的轻量化道路缺陷检测方法,所述检测方法包括以下步骤:获取道路缺陷检测数据集GRDDC;将YOLOv5模型的主干网络用GhostNet轻量化网络替代;引入了度量学习中的中心损失函数;对YOLOv5中的置信度损失和分类损失函数进行约束,得到新的损失函数;将改进后的YOLOv5模型中进行训;将测试集中的图像输入改进后YOL0v5目标检测模型中,得到该模型在测试集中的检测结果。该发明检测方法在初始YOLOv5目标检测模型的基础上利用GhostNet模块替换YOLOv5中的主干网络进行特征提取,使得网络更好服务于移动端,采用注意力机制CA更加关注通道之间的信息,更好的分配权重,保证了模型目标检测的准确率,利用中心损失作为正则化项对模型损失函数约束。从而更加准确检测缺陷的类别。图像增强技术为:将输入图像送入改进后的目标检测模型中,通过主干网络的特征提取,再经过加入注意力机制CA提高通道信息,进行特征增强。也不能得到不同类型路面的数据集。
可见,现有的图像增强技术不能得到不同类型路面且准确的数据集。此外,预处理仅仅对图像进行打标签,病害特征不够明显。另外,训练时,常用的R-CNN算法和YOLO系列算法Inference速度不够快。
发明内容
本发明所要解决的技术问题是提供一种路面缺陷检测模型建立方法、检测方法、存储介质及设备,图像增强处理能够得到不同类型路面的数据集,从而增加数据集,并且对病害图片的预处理能够使得病害特征更加明显,提高检测的准确性。
为解决上述问题,本发明采用的技术方案为:路面缺陷检测模型建立方法,包括
S1、获取路面图像组成的原始数据集;
S2、通过CycleGan网络将原始数据集中的图像转换为其他类型路面的正常图像,得到增强正常数据集;
S3、对原始数据集的病害图像打标签,然后通过Scharr滤波器求解打上标签的病害图像,得到X方向上的梯度和Y方向的梯度,并将X方向和Y方向的图像进行融合,得到特征明显的病害图;
S4、将特征明显的病害图上的病害特征裁剪下来,并添加至增强正常数据集上,得到增强病害数据集;
S5、将原始数据集与增强病害数据集结合,输入训练模型进行训练,得到路面缺陷检测模型。
2、如权利要求1所述的路面缺陷检测模型建立方法,其特征在于,步骤S5中,训练模型为集成卷积块注意力模块的YOLOv5网络,卷积块注意力模块包括通道注意力模块和空间注意力模;
训练时,根据通道注意力公式,获取需要的最为重要的通道,再通过激活函数获得非线性化的一维卷积;一维卷积与原有的向量图结合生成新的向量图,再通过空间注意力公式获得两个池化特征图,之后根据激活函数获得新的特征图。
进一步地,步骤S3中,采用LabelImg,手动对原始数据集的病害图像打标签。
路面缺陷检测方法,获取采集的路面图像,将路面图像输入上述路面缺陷检测模型,得到检测结果。
存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现权利要求4所述的方法。
路面缺陷检测设备,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器用于调取所述计算机程序并实现上述路面缺陷检测方法。
本发明的有益效果是:1、通过CycleGan网络将原始数据集中的图像转换为其他类型路面的正常图像,然后将病害特征添加到转换后的正常图像上,可以得到更多的病害图像,扩大数据集。如将水泥路面的图像通过CycleGan网络转换为正常的沥青路面图像和大理石路面图像,图像的数量则增加了2倍,数据集扩大效果好。
2、采用Scharr滤波器对病害图像进行预处理,病害特征更加明显,计算机能够更加准确、快速地识别病害种类。
附图说明
图1是CycleGan网络原理图;
图2是CycleGan生成器示意图;
图3是将沥青路面转化为其他类型路面的示意图;
图4是Scharr滤波器原理图;
图5是步骤S4中DA操作示意图;
图6是YOLOv5-CBAM网络结构图;
图7是卷积块注意力模块示意图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
本发明的路面缺陷检测模型建立方法,包括
S1、获取路面图像组成的原始数据集。路面图像可以通过拍摄得到。
S2、通过CycleGan网络将原始数据集中的图像转换为其他类型路面的正常图像,得到增强正常数据集。
正常图像是指不存在病害的路面图像。CycleGan网络可以将路面图像(包括正常图像和病害图像)转换为其他类型路面的正常图像,本发明所述的路面类型包括但不限于柏油路、沥青路、水泥路、大理石路等各种常见的路面。经过CycleGan网络转换后,得到的增强正常数据集中的图像数量是原始数据集数量的数倍,从而有效地扩大了数据集,增强效果好。
CycleGan网络的原理如图1所示,CycleGan生成器如图2所示,图中,
公式1:
E|G(F(x))-x|
公式2:
E|F(G(y))-y|
其中,E为概率统计中期望;
G为生成器1(将X数据集中的图片生成为Y数据集中的图片);
F为生成器2(将Y数据集中的图片生成为X数据集中的图片),其中X,Y分别代表数据集1和数据集2。
公式3:
LossGAN(G,Dx)=E[log(Dx(x))]+E[log(1-Dx(G(x)))]
公式4:
Lossfull=LossGAN(G,Dx)+LossGAN(F,Dy)+λLosscycle
其中,Loss为损失函数,Loss=LossGAN+LosScycle;
LossGAN:保证生成器和判断器相互进化,进而保证生成器能产生更真实的图片;
Losscycle:保证生成器的输出图片与输入图片只是风格不同,而内容相同;
LosSfull:全损失函数;
λ为eyele consistency losses和adversarial losses的权重比,而对于其中两个损失函数的解释为:eyele consistency losses:防止生成器G与F相互矛盾,即两个生成器生成数据之后还能变换回来近似看成X->Y->X;
adversarial losses:尽可能让生成器生成的数据分布接近于真实的数据分布;
DX:判别器1(对生出器1生出图片进行判断好坏,判断数值0~1区间,数值接近1为像,接近0为不像);
DY:判别器2(对生出器2生出图片进行判断好坏,判断数值0~1区间,数值接近1为像,接近0为不像);
E:概率统计中期望;
Input:输入数据;
ReflectionPad2d:二维反射填充,图像增强技术,将图像沿着边缘上下左右对称转换,增大图像的分辨率;
Residual block:残差块,将数据进行恢复增强;
CIL:卷积,IN正则化、Leaky ReLU激活函数;
CILR:反卷积、IN标准化、ReLU激活函数;
IN正则化:在图像像素上,对H、W做归一化,统计每个样本的每个通道上特征的均值和方差,用于风格化迁移;
Leaky ReLU激活函数:分段线性函数,把所有负值都*α,正值不变,α通常为0.01;
ReLU激活函数:分段线性函数,把所有的负值都变为0,正值不变;
Encoding:编码器,利用卷积网络从输入图像中提取特征;
Transformation:转换器,组合图像的不同相近特征,基于该特征,确定如何将图像的特征向量从DA域转换为DB域的特征向量;
Decoding:解码器,从特征向量中还原出低级特征。
转化过程为:首先将原始图像进行解码操作,输入(Inputs)后,通过图像增强(ReflectionPad2d)技术,将图像沿着边缘上下左右对称,增大图像的分辨率;然后将增强后图像输入卷积层,进行三次(CIL)操作(①将图像卷积操作,缩小图像大小。②将图像IN正则化,使得图像像素上,对图像H、W做归一化,统计每个样本的每个通道上特征的均值和方差。③通过Leaky ReLU激活函数,将②中获得的均值和方差进行分段线性函数处理,把所有负值都*α,正值不变,α通常为0.01)。
其次图像在通过解码操作之后,需要Residual block模块操作之后再传输编码器进行编码。其中Residual block模块,默认是9个重复模块,将图像数据进行恢复增强。
最后通过Residual block模块恢复增强的数据,输入编码器,进行两次(CTIR)操作(①将图像反卷积操作,提高图像大小。②将图像IN正则化,使得图像像素上,对图像H、W做归一化,统计每个样本的每个通道上特征的均值和方差。③通过ReLU激活函数,将②中获得的均值和方差进行分段线性函数处理,把所有的负值都变为0,正值不变),恢复图像的大小。再通过图像增强(ReflectionPad2d)技术,将图像分辨率提升,通过卷积(Conv,Tanh)恢复到图像原大小,有效的解决对象边缘信息。
本发明图像增强的一种具体实施例如图3所示,采用如图2所示的生成器将沥青路面图像转换为其他类型的正常路面图像。
S3、对原始数据集的病害图像打标签,然后通过Scharr滤波器求解打上标签的病害图像,得到X方向上的梯度和Y方向的梯度,并将X方向和Y方向的图像进行融合,得到特征明显的病害图。
对病害图像打标签时采用LabelImg,手动对原始数据集的病害图像打标签。
本发明将路面病害分为裂缝、坑槽和修补三大类,打标签时,打开LabelImg软件,点击Open Dir选项,选择原始数据集所在的文件,打开原始数据集;点击Create RectBox选项,对图片中需要标记的位置进行框选,并且标记相应的标签。
LabelImg为现有软件,按照上述操作即可完成打标签。
Scharr滤波器原理如图4所示,首先根据公式5:
P5x=3(P3-P1)+10(P6-P4)+3(P9-P7)
得到图片X方向的梯度(Scharr X);
再根据公式6:
P5y=3(P7-P1)+10(P8-P2)+3(P9-P3)
得到图片Y方向的梯度(Scharr Y),再将X方向和Y方向的图像进行融合得到目标输出图(Scharr XY)。
公式5和公式6中,Gx为x方向的梯度,Gy为y方向的梯度,其中-3、-10、3、10、0为卷积核权重,P1~P9为像素点,而P5为需要计算的像素点,其中P5x和P5y为该像素点对于x方向和y方向的梯度。
通过该模块方法,可以检测到不容易被发现的轮廓,加深病害特征,比如图4中,原图经过处理后,裂纹深度更加明显(相对于计算机识别来说),计算机可以更加快速、准确地识别出该病害。还可以获得到道路病害的梯度(边缘特征值),以方便为后续DA操作模块进行图像融合,获得更多有病害的数据集。
S4、DA操作:将特征明显的病害图上的病害特征裁剪下来,并添加至增强正常数据集上,如图5所示,得到增强病害数据集。
该操作为现有技术,参考:An image data augmentation algorithm based onYOLOv5s-DA for pavement distress detection,CBAM:卷积块注意模块;ECCV2018。
S5、将原始数据集与增强病害数据集结合,输入训练模型进行训练,得到路面缺陷检测模型。
增强病害数据集与原始数据集合并后,可以得到不同类型路面的不同类型的病害图像,训练数据集丰富,扩展了用于训练的数据集的数量,有利于得到更加准确、能够检测出多种路面、多种病害缺陷的检测模型。
本发明采用的训练模型为集成卷积块注意力模块(CBAM)的YOL0v5网络,即YOL0v5-CBAM网络,卷积块注意力模块如图7所示,包括通道注意力模块和空间注意力模;
训练时,根据通道注意力公式,获取需要的最为重要的通道,再通过激活函数获得非线性化的一维卷积;一维卷积与原有的向量图结合生成新的向量图,再通过空间注意力公式获得两个池化特征图,之后根据激活函数获得新的特征图。
通过卷积注意力模块机制处理后,相较于原来的YOLOv5网络,更容易获得目标特征,并且提高了网络性能。
传统的YOLOv5模型包括YOLOv5s、YOL0v5m、YOL0v5l和YOLOv5x等,本发明所采用的YOLOv5-CBAM网络模型与传统YOLOv5模型的各指标见下表:
Model | mAP | Speed | Size | Params |
YOLOv5s | 55.4 | 2.2ms | 640 | 7.4M |
YOLOv5m | 62.8 | 2.8ms | 640 | 21.6M |
YOLOv51 | 66.2 | 3.9ms | 640 | 47.5M |
YOLOv5x | 67.6 | 6.2ms | 640 | 88.6M |
YOLOv5-CBAM | 79.9 | 3.1ms | 640 | 8.2M |
其中,mAP代表所有目标的识别精度均值,数值越高,代表识别效果越好。Speed代表识别每百张图片的推理速度,数值越低,代表识别耗时越少。Size代表输入网络的图片大小。Params代表模型占用内存的大小,数值越低,代表占用空间越少。
本发明YOL0v5-CBAM的mAP值为79.9%,相比手YOL0v5x进一步提高了22.3%,且在所有模型中为最高。在Speed值指标上,路面病害的识别速度介于YOLOv5s和YOL0v5m之间,比YOL0v5x快了一倍。从Params值指标也可以看出YOL0v5-CBAM和YOLOv5s的轻量级别几乎相同,很好的符合了将其部署到边缘计算板的需求,Yolov5-CBAM操作可以更好地提取目标特征,其改进具有有效性。
经过多次试验,获得到的模型应用于路面缺陷检测中,对于坑槽,裂缝,修补可以明显识别出来,并且针对于坑槽病害的检测准确率高达95%。相较于没有添加CBAM模块的YOL0v5,Inference速度明显提高。
本发明的路面缺陷检测方法,获取采集的路面图像,将路面图像输入上述步骤S5训练后得到的缺陷检测模型,得到检测结果。
存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述路面缺陷检测方法。存储介质具体可以是U盘、移动硬盘、计算机存储器、手机存储器等。
路面缺陷检测设备,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器用于调取所述计算机程序并实现上述路面缺陷检测方法。路面缺陷检测设备具体可以是计算机、手机等设备。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.路面缺陷检测模型建立方法,其特征在于,包括
S1、获取路面图像组成的原始数据集;
S2、通过CycleGan网络将原始数据集中的图像转换为其他类型路面的正常图像,得到增强正常数据集;
S3、对原始数据集的病害图像打标签,然后通过Scharr滤波器求解打上标签的病害图像,得到X方向上的梯度和Y方向的梯度,并将X方向和Y方向的图像进行融合,得到特征明显的病害图;
S4、将特征明显的病害图上的病害特征裁剪下来,并添加至增强正常数据集上,得到增强病害数据集;
S5、将原始数据集与增强病害数据集结合,输入训练模型进行训练,得到路面缺陷检测模型。
2.如权利要求1所述的路面缺陷检测模型建立方法,其特征在于,步骤S5中,训练模型为集成卷积块注意力模块的YOLOv5网络,卷积块注意力模块包括通道注意力模块和空间注意力模;
训练时,根据通道注意力公式,获取需要的最为重要的通道,再通过激活函数获得非线性化的一维卷积;一维卷积与原有的向量图结合生成新的向量图,再通过空间注意力公式获得两个池化特征图,之后根据激活函数获得新的特征图。
3.如权利要求1所述的路面缺陷检测模型建立方法,其特征在于,步骤S3中,采用LabelImg,手动对原始数据集的病害图像打标签。
4.路面缺陷检测方法,其特征在于,获取采集的路面图像,将路面图像输入权利要求1、2或3建立的路面缺陷检测模型,得到检测结果。
5.存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求4所述的方法。
6.路面缺陷检测设备,其特征在于,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器用于调取所述计算机程序并实现权利要求4所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211675037.5A CN116071307A (zh) | 2022-12-26 | 2022-12-26 | 路面缺陷检测模型建立方法、检测方法、存储介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211675037.5A CN116071307A (zh) | 2022-12-26 | 2022-12-26 | 路面缺陷检测模型建立方法、检测方法、存储介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116071307A true CN116071307A (zh) | 2023-05-05 |
Family
ID=86181334
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211675037.5A Pending CN116071307A (zh) | 2022-12-26 | 2022-12-26 | 路面缺陷检测模型建立方法、检测方法、存储介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116071307A (zh) |
-
2022
- 2022-12-26 CN CN202211675037.5A patent/CN116071307A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109035149B (zh) | 一种基于深度学习的车牌图像去运动模糊方法 | |
CN111681273B (zh) | 图像分割方法、装置、电子设备及可读存储介质 | |
CN112232391B (zh) | 一种基于U-net网络和SC-SAM注意力机制的大坝裂缝检测方法 | |
TW201732651A (zh) | 一種單詞的分割方法和裝置 | |
CN111862143B (zh) | 一种河堤坍塌自动监测方法 | |
CN111191649A (zh) | 一种识别弯曲多行文本图像的方法与设备 | |
CN112989995B (zh) | 文本检测方法、装置及电子设备 | |
CN112164077B (zh) | 基于自下而上路径增强的细胞实例分割方法 | |
CN112733858B (zh) | 基于字符区域检测的图像文字快速识别方法及装置 | |
CN111311515B (zh) | 一种错误区域自动检测的深度图像快速迭代修复方法 | |
CN116206112A (zh) | 基于多尺度特征融合和sam的遥感图像语义分割方法 | |
CN111310690B (zh) | 基于cn和三通道胶囊网络的森林火灾识别方法及装置 | |
Zhao et al. | Research on detection method for the leakage of underwater pipeline by YOLOv3 | |
CN112329771A (zh) | 一种基于深度学习的建筑材料样本识别方法 | |
CN116597438A (zh) | 一种基于Yolov5的改进型水果识别方法及识别系统 | |
CN107292255B (zh) | 基于特征矩阵相似度分析的手写数字识别方法 | |
CN111291712B (zh) | 基于插值的cn和胶囊网络的森林火灾识别方法及装置 | |
CN115294392B (zh) | 基于生成网络模型的可见光遥感图像云去除方法及系统 | |
CN116524522A (zh) | 一种基于卷积神经网络的女书文字识别方法及系统 | |
CN116740135A (zh) | 红外弱小目标跟踪方法、装置、电子设备及存储介质 | |
CN113887652B (zh) | 基于形态和多示例学习的遥感图像弱小目标检测方法 | |
CN115439850A (zh) | 基于审单的图文字符识别方法、装置、设备及存储介质 | |
CN116071307A (zh) | 路面缺陷检测模型建立方法、检测方法、存储介质及设备 | |
CN113065407B (zh) | 基于注意力机制和生成对抗网络的财务票据印章擦除方法 | |
CN115223033A (zh) | 一种合成孔径声呐图像目标分类方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |