CN116993730A - 一种基于8k图像的裂缝检测方法 - Google Patents
一种基于8k图像的裂缝检测方法 Download PDFInfo
- Publication number
- CN116993730A CN116993730A CN202311249742.3A CN202311249742A CN116993730A CN 116993730 A CN116993730 A CN 116993730A CN 202311249742 A CN202311249742 A CN 202311249742A CN 116993730 A CN116993730 A CN 116993730A
- Authority
- CN
- China
- Prior art keywords
- image
- crack detection
- original
- images
- crack
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 90
- 238000001914 filtration Methods 0.000 claims abstract description 34
- 238000012549 training Methods 0.000 claims abstract description 20
- 230000002146 bilateral effect Effects 0.000 claims abstract description 18
- 238000010586 diagram Methods 0.000 claims abstract description 10
- 230000009467 reduction Effects 0.000 claims abstract description 8
- 238000000605 extraction Methods 0.000 claims abstract description 5
- 238000005070 sampling Methods 0.000 claims abstract description 5
- 238000000034 method Methods 0.000 claims description 16
- 238000002372 labelling Methods 0.000 claims description 12
- 239000000463 material Substances 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 abstract description 2
- 238000004364 calculation method Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000011176 pooling Methods 0.000 description 4
- 230000000903 blocking effect Effects 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- HPTJABJPZMULFH-UHFFFAOYSA-N 12-[(Cyclohexylcarbamoyl)amino]dodecanoic acid Chemical compound OC(=O)CCCCCCCCCCCNC(=O)NC1CCCCC1 HPTJABJPZMULFH-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000004568 cement Substances 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 239000004579 marble Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0985—Hyperparameter optimisation; Meta-learning; Learning-to-learn
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/52—Scale-space analysis, e.g. wavelet analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20024—Filtering details
- G06T2207/20028—Bilateral filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
- G06T2207/30132—Masonry; Concrete
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于8K图像的裂缝检测方法,属于裂缝检测技术领域。所述裂缝检测方法包括:构建裂缝检测模型;对所述裂缝检测模型进行训练;将待检测图像输入所述裂缝检测模型进行检测,得到裂缝检测结果;其中,所述裂缝检测模型包括:双边滤波模块,用于对所述待检测图像进行降噪滤波;编码路径,用于对降噪滤波后的所述待检测图像进行特征提取,生成特征图;注意力模块,用于对编码路径输出的所述特征图进行特征权重调整;解码路径,用于对所述注意力模块输出的特征图执行卷积和上采样运算,得到裂缝预测图像。本发明减少了模型的参数量和神经网络的复杂度。
Description
技术领域
本发明属于裂缝检测技术领域,特别是涉及一种基于8K图像的裂缝检测方法。
背景技术
在传统的路面裂缝检测方法中,通常需要耗费大量人力和时间,相较之下,现今已经出现了多种自动化路面裂缝数据采集和检测方法。采用现代道路智能检测方法不仅更高效,而且获取的数据更为丰富和准确,同时成本也更为低廉。在数据采集方面,除了道路智能检测车,还包括无人机等。而在路面裂缝检测方法方面,数字图像处理、超声波检测和射线扫描等方法均得到应用。虽然基于传统图像处理方法的自动化道路裂缝检测系统相对于人工检测精度更高成本更低,但是这种方法在处理裂缝图像时面临一些问题。裂缝图像往往具有强烈的噪声,同时前景和背景边界有时不清晰,这可能导致提取出的裂缝被中断,且系统容易将非裂缝区域错误分类为裂缝。为应对这些挑战,基于深度学习的道路裂缝检测已成为学术界和工业界的主流研究方法。深度学习具有出色的抗噪能力和自动特征提取能力,能够在复杂图像中识别特定信息和特征,可以为道路裂缝检测带来更精确的结果。然而,在应对灰度不均匀、图像质量不稳定等问题时,仍需要进一步的研究和创新。
为了解决传统裂缝检测方法的限制,研究者们正在采用一些前沿技术进行改进。改进方法包括对网络结构的优化,例如改进的Mask R-CNN和改进的Transformer模块。另外,研究人员还尝试将不同的方法融合起来,例如将CNN与支持向量机(SVM,SupportVector Machine)相结合,或将VGG16与Faster R-CNN相结合。但这些方法在处理8K图像时也会遇到特征丢失,检测速率变慢等挑战,比如,由于图像分辨率过高,导致更多噪声干扰目标区域,使目标纹理不清晰,增加网络训练的难度,并需要更深层次的网络才可以学习到目标裂缝特征,这会带来更多的参数量和计算量,消耗更多资源。此外,直接处理原始的8K图像也会影响网络推理速度和系统开销。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于8K图像的裂缝检测方法。
本发明的目的是通过以下技术方案来实现的:一种基于8K图像的裂缝检测方法,包括:
构建裂缝检测模型;
对所述裂缝检测模型进行训练;
将待检测图像输入所述裂缝检测模型进行检测,得到裂缝检测结果;
其中,所述裂缝检测模型包括:
双边滤波模块,用于对所述待检测图像进行降噪滤波;
编码路径,用于对降噪滤波后的所述待检测图像进行特征提取,生成特征图;
注意力模块,用于对编码路径输出的所述特征图进行特征权重调整;
解码路径,用于对所述注意力模块输出的特征图执行卷积和上采样运算,得到裂缝预测图像。
进一步地,对所述裂缝检测模型进行训练,包括:
获取若干张包含道路裂缝的原始8K图像;
对所述原始8K图像进行标注,生成真实标签数据集;
基于所述真实标签数据集对所述裂缝检测模型进行训练。
进一步地,获取若干张包含道路裂缝的原始8K图像,包括:
获取多种材质路面的视频影像;
按第一预设值的交叠比将所述视频影像的所有帧保存为原始8K图像;
从所有原始8K图像中筛选出包含道路裂缝的原始8K图像。
进一步地,所述第一预设值为5%-10%。
进一步地,对所述原始8K图像进行标注,生成真实标签数据集,包括:
对所述原始8K图像进行标注;
将标注后的原始8K图像由JSON格式转换为VOC格式,生成真实标签数据集。
进一步地,对所述原始8K图像进行标注,包括:
为所述原始8K图像标注目标名称、类别和大小。
进一步地,将待检测图像输入所述裂缝检测模型进行检测,得到裂缝检测结果,包括:
将待检测图像分块处理为多张样本图像;
将所述多张样本图像同时输入所述裂缝检测模型进行裂缝检测;
将所述多张样本图像的裂缝检测结果进行融合生成所述待检测图像的裂缝检测结果。
本发明的有益效果是:
(1)本发明采用改进的双边滤波算法对原始的8K图像有效地消除背景噪声,保留目标裂缝边缘信息,增强细节,使目标区域更加突出,采用轻量级CNN网络就可以准确的提取裂缝的关键特征,这样可以有效减少模型的参数量和神经网络的复杂度;
(2)本发明采用分块处理和融合方法,可以减少冗余的网络计算,提高内存效率,解决了传统推理过程导致的大量重复计算和资源浪费;将多个样本一起进行前向计算,从而共享相同的计算步骤,再将子区域的处理结果进行融合,在计算上节省了时间和资源;
(3)本发明通过将计算资源从CPU转移到GPU进行处理,可以加速深度学习模型的训练和推理过程,进一步提高裂缝检测的效率和性能。
附图说明
图1为本发明中裂缝检测方法的一种流程图;
图2为双边滤波时的一种示意图;
图3为分别采用高斯滤波和双边滤波对第一张原始图像进行处理后的效果图;
图4为分别采用高斯滤波和双边滤波对第二张原始图像进行处理后的效果图;
图5为分别采用高斯滤波和双边滤波对第三张原始图像进行处理后的效果图;
图6为网络训练过程中的一种示意图。
具体实施方式
下面将结合实施例,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有付出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
参阅图1至图6,本发明提供一种基于8K图像的裂缝检测方法:
如图1所示,裂缝检测方法包括步骤S100至步骤S300。
步骤S100.构建裂缝检测模型。
所述裂缝检测模型包括双边滤波模块、编码路径、注意力模块和解码路径。
双边滤波模块用于对所述待检测图像进行降噪滤波。
以图2所示图像为例对双边滤波降噪的过程进行说明,将该图像看做是10*10的一张图像,图中的数字表示每个点的像素值;在图中存在一个5*5大小的滑动窗口,需要求出中心点灰度值146的新像素值。
首先遍历整个窗口,第一个遍历到的点是165,那么中心点与该点的空间域计算结果为:
式中,表示中心点与遍历到的点的空间域,/>为空间域标准差,e为自然常数。
然后第二,计算中心点与该点的值域结果:
式中,表示中心点与遍历到的点的值域,/>为值域标准差,e为自然常数。
最后遍历整个窗口,将窗口内每个像素点都与中心点建立联系,求出它们的空间域和值域的值,将空间域和值域的值相乘即得到每个点的权重Wp。遍历结束后,用每个点的权重Wp乘以该点的像素值I,并求和作为分子;将每个点的权重Wp相加作为分母,两者相除,即得到需要的新输出图像中心点的像素值。
空间域sigma(space)越大,图像越平滑;空间域越小,中心点权重越大,周围点权重越小,对图像的滤波作用越小,趋于零时,输出等同于原图。值域sigma(color)越大,边缘越模糊,极限情况为simga无穷大,值域系数近似相等,与高斯模板(空间域模板)相乘后可认为等效于高斯滤波。Sigma(color)越小,边缘越清晰,极限情况为simga无限接近0,与高斯模板相乘进行滤波的结果等效于源图像。本发明中双边滤波空间域和值域等参数最终确定为:diameter(直径)=25, sigma_color=100, sigma_space=100。
编码路径用于对降噪滤波后的所述待检测图像进行特征提取,生成特征图。
在一些实施例中,编码路径包括灵活的解码模块(FLD)。随着层级从深到浅,传统解码模块中特征图的尺寸逐渐增大,通道数保持不变。而 FLD 模块中特征图的通道数逐渐减小,可以平衡不同层的算量。同时,根据编码模块灵活调整解码模块中通道数,平衡编码模块和解码模块的算量,使得整个模型更加高效。
注意力模块用于对编码路径输出的所述特征图进行特征权重调整。
本实施例中使用PP-LiteSeg统一注意力模块(UAFM)来有效地加强特征表示,该模块包含空间注意力模块(b)和通道注意力模块(c)。空间注意力模块使用输入特征图的空间相互关系来生成权重α1,表示空间维度不同像素点的重要性。通道注意力模块使用输入特征图的通道相互关系来生成权重α2,表示不同通道的重要性。所以,UAFM 充分利用了输入特征的空间以及通道之间的关系,加强特征表示。
解码路径用于对所述注意力模块输出的特征图执行卷积和上采样运算,得到裂缝预测图像。
在一些实施例中,解码路径由金字塔池化模块构成,PP-LiteSeg 设计了一种简易金字塔池化模块(SPPM)。使用空间金字塔池化操作来融合特征图的信息,其中有三个全局池化算子,分别输出1*1、2*2、4*4尺寸的特征图;对小尺寸的特征图执行卷积和上采样运算,得到通道和尺寸相同的特征图;将上一步的输出进行相加,执行一个卷积运算后,得到最终的特征图。SPPM 模块减小了中间特征图的通道数、移除了跳跃连接、使用加法算子替换级联算子。
本实施例中的裂缝检测模型通过编码路径和解码路径提取低等级和高等级道路裂缝语义特征,并通过多尺度跨越连接将编码路径特征输入解码路径中,补充细节特征,通过预测模块检测路面图像中的裂缝。
步骤S200.对所述裂缝检测模型进行训练。
在一些实施例中,对所述裂缝检测模型进行训练,包括步骤S210至步骤S230。
步骤S210.获取若干张包含道路裂缝的原始8K图像。
例如,将8K摄像机调试相机视场与角度,确保获取数据清晰且覆盖范围广;采集不同材质的不同病害程度的路面原始影像,例如水泥路面、大理石路面等;以5%-10%的交叠比将所述视频影像的所有帧保存为原始8K图像;从所有原始8K图像中筛选出包含道路裂缝的原始8K图像。
步骤S220.对所述原始8K图像进行标注,生成真实标签数据集。
对所述原始8K图像进行标注,生成真实标签数据集,包括步骤S221和步骤S222。
步骤S221.对所述原始8K图像进行标注。
例如,通过百度飞桨图像标注工具EISeg对输入的图像进行标注(包括目标名称、类别、大小等),生成能被图像分割网络认识的数据信息。
步骤S222.将标注后的原始8K图像由JSON格式转换为VOC格式,生成真实标签数据集。
在一些实施例中,将真实标签数据集划分为训练集、验证集和测试集,其中,训练集:验证集:测试集=7:2:1。
步骤S230.基于所述真实标签数据集对所述裂缝检测模型进行训练。
在一些实施例中,使用GitHub开源的PaddleSeg框架和CUDA搭建基于GPU的模型训练和测试环境;通过比较不同模型检测性能和训练、预测效率,最终选用PP-liteseg作为最终模型;测试不同学习率和批次大小下模型性能,通过横向比较检测结果,采用540*480大小的图像块进行训练,设置batch_size=6,learning_rate= 0.01,iters=10000等超参数,batch size为批量大小,learning_rate为学习率,iters为迭代次数;迭代训练,设置模型每迭代500次进行一次结果打印,并保存最好的模型权重文件;模型加载,将训练好的深度学习模型加载到内存中,模型包含网络结构和相应的权重参数。
步骤S300.将待检测图像输入所述裂缝检测模型进行检测,得到裂缝检测结果。
在一些实施例中,将待检测图像输入所述裂缝检测模型进行检测,得到裂缝检测结果,包括:将待检测图像分块处理为多张样本图像;将所述多张样本图像同时输入所述裂缝检测模型进行裂缝检测;将所述多张样本图像的裂缝检测结果进行融合生成所述待检测图像的裂缝检测结果。
本实施例中对待检测图像进行分块处理,并对检测结果进行融合。分块处理:将待检测图像数据划分为小批次(batch),每个批次包含多张样本图像,采用batch size=4和batch size=8,这些批次的样本图像同时输入到模型中进行推理,可以充分利用硬件设备(如GPU)的并行计算能力,加快推理速度。同时,批处理推理还可以优化内存使用,减少了数据传输的开销。批处理包括前向传播:对于每个批次中的图像数据,执行前向传播操作。前向传播是指将输入数据通过深度学习模型的网络层,逐层计算输出结果的过程。这一步骤通过矩阵乘法和激活函数等运算实现。后处理:对于每个批次的输出结果,进行后处理操作。使用Softmax函数计算类别概率,并选择概率最高的类别作为最终预测结果。结果融合:将每个批次的预测结果整合起来,得到最终的道路裂缝检测结果。
本实施例提供的路面裂缝检测方法不仅能够确保高质量的检测结果,还能提升算法效率,实现了对8K图像道路裂缝的实时检测,从而推动了工程应用与行业落地。
表1给出了本实施例中裂缝检测模型的mIoU和Acc,其中mIoU为平均交并比,Acc为预测准确率。实验结果表明,本实施例所提出的采用双边滤波算法的模型在mIoU和Acc表现更好。
表1 无滤波与有滤波mIoU、Acc比较
表2给出了不采用分块批处理推理方法和采用分块批处理推理方法时的批次时间开销。结果显示,采用分块批处理推理方法的模型具有更短的运行时间。
表2 单样本推理与批处理推理速度比较
图3、图4和图5展示了三组截取的部分8K图像经过滤波后的效果。分辨率分别为368*640、540*480、2000*1125。其中左侧是原始输入图像,中间是采用传统高斯滤波后的图像,右侧则是经过本实施例的双边滤波处理后的图像。结果明确地显示,采用双边滤波的图像在噪音消除和裂缝细节显示方面均优于传统高斯滤波。
图6展示了网络训练过程中的损失曲线,其中Train表示训练,loss表示损失。位于上方的曲线L1代表了未采用双边滤波算法的模型收敛速度,而位于下方的曲线L2则表示采用了双边滤波算法的模型收敛速度。结果清晰地显示,采用双边滤波算法的模型收敛速度更快,进一步验证了本实施例方法的有效性。
以上所述仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (7)
1.一种基于8K图像的裂缝检测方法,其特征在于,包括:
构建裂缝检测模型;
对所述裂缝检测模型进行训练;
将待检测图像输入所述裂缝检测模型进行检测,得到裂缝检测结果;
其中,所述裂缝检测模型包括:
双边滤波模块,用于对所述待检测图像进行降噪滤波;
编码路径,用于对降噪滤波后的所述待检测图像进行特征提取,生成特征图;
注意力模块,用于对编码路径输出的所述特征图进行特征权重调整;
解码路径,用于对所述注意力模块输出的特征图执行卷积和上采样运算,得到裂缝预测图像。
2.根据权利要求1所述的一种基于8K图像的裂缝检测方法,其特征在于,对所述裂缝检测模型进行训练,包括:
获取若干张包含道路裂缝的原始8K图像;
对所述原始8K图像进行标注,生成真实标签数据集;
基于所述真实标签数据集对所述裂缝检测模型进行训练。
3.根据权利要求2所述的一种基于8K图像的裂缝检测方法,其特征在于,获取若干张包含道路裂缝的原始8K图像,包括:
获取多种材质路面的视频影像;
按第一预设值的交叠比将所述视频影像的所有帧保存为原始8K图像;
从所有原始8K图像中筛选出包含道路裂缝的原始8K图像。
4.根据权利要求3所述的一种基于8K图像的裂缝检测方法,其特征在于,所述第一预设值为5%-10%。
5.根据权利要求2所述的一种基于8K图像的裂缝检测方法,其特征在于,对所述原始8K图像进行标注,生成真实标签数据集,包括:
对所述原始8K图像进行标注;
将标注后的原始8K图像由JSON格式转换为VOC格式,生成真实标签数据集。
6.根据权利要求2所述的一种基于8K图像的裂缝检测方法,其特征在于,对所述原始8K图像进行标注,包括:
为所述原始8K图像标注目标名称、类别和大小。
7.根据权利要求1所述的一种基于8K图像的裂缝检测方法,其特征在于,将待检测图像输入所述裂缝检测模型进行检测,得到裂缝检测结果,包括:
将待检测图像分块处理为多张样本图像;
将所述多张样本图像同时输入所述裂缝检测模型进行裂缝检测;
将所述多张样本图像的裂缝检测结果进行融合生成所述待检测图像的裂缝检测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311249742.3A CN116993730B (zh) | 2023-09-26 | 2023-09-26 | 一种基于8k图像的裂缝检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311249742.3A CN116993730B (zh) | 2023-09-26 | 2023-09-26 | 一种基于8k图像的裂缝检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116993730A true CN116993730A (zh) | 2023-11-03 |
CN116993730B CN116993730B (zh) | 2023-12-15 |
Family
ID=88523521
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311249742.3A Active CN116993730B (zh) | 2023-09-26 | 2023-09-26 | 一种基于8k图像的裂缝检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116993730B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104992421A (zh) * | 2015-07-09 | 2015-10-21 | 西安电子科技大学 | 一种基于OpenCL的图像去噪算法的并行优化方法 |
CN111028217A (zh) * | 2019-12-10 | 2020-04-17 | 南京航空航天大学 | 一种基于全卷积神经网络的图像裂缝分割方法 |
CN111257341A (zh) * | 2020-03-30 | 2020-06-09 | 河海大学常州校区 | 基于多尺度特征与堆叠式全卷积网络的水下建筑物裂缝检测方法 |
CN112634292A (zh) * | 2021-01-06 | 2021-04-09 | 烟台大学 | 一种基于深度卷积神经网络的沥青路面裂缝图像分割方法 |
CN114705689A (zh) * | 2022-04-14 | 2022-07-05 | 西安建筑科技大学 | 一种基于无人机的建筑物外立面裂缝检测方法及系统 |
CN116029980A (zh) * | 2022-11-18 | 2023-04-28 | 武汉科技大学 | 一种基于改进SegNet的沥青路面损坏检测及评估方法 |
CN116630267A (zh) * | 2023-05-24 | 2023-08-22 | 西安理工大学 | 基于无人机与激光雷达数据融合的路基沉降监测方法 |
CN116664822A (zh) * | 2023-06-01 | 2023-08-29 | 广州阅数科技有限公司 | 一种基于自动切图算法的图像目标检测方法 |
-
2023
- 2023-09-26 CN CN202311249742.3A patent/CN116993730B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104992421A (zh) * | 2015-07-09 | 2015-10-21 | 西安电子科技大学 | 一种基于OpenCL的图像去噪算法的并行优化方法 |
CN111028217A (zh) * | 2019-12-10 | 2020-04-17 | 南京航空航天大学 | 一种基于全卷积神经网络的图像裂缝分割方法 |
CN111257341A (zh) * | 2020-03-30 | 2020-06-09 | 河海大学常州校区 | 基于多尺度特征与堆叠式全卷积网络的水下建筑物裂缝检测方法 |
CN112634292A (zh) * | 2021-01-06 | 2021-04-09 | 烟台大学 | 一种基于深度卷积神经网络的沥青路面裂缝图像分割方法 |
CN114705689A (zh) * | 2022-04-14 | 2022-07-05 | 西安建筑科技大学 | 一种基于无人机的建筑物外立面裂缝检测方法及系统 |
CN116029980A (zh) * | 2022-11-18 | 2023-04-28 | 武汉科技大学 | 一种基于改进SegNet的沥青路面损坏检测及评估方法 |
CN116630267A (zh) * | 2023-05-24 | 2023-08-22 | 西安理工大学 | 基于无人机与激光雷达数据融合的路基沉降监测方法 |
CN116664822A (zh) * | 2023-06-01 | 2023-08-29 | 广州阅数科技有限公司 | 一种基于自动切图算法的图像目标检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116993730B (zh) | 2023-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109190752B (zh) | 基于深度学习的全局特征和局部特征的图像语义分割方法 | |
CN114120102A (zh) | 边界优化的遥感图像语义分割方法、装置、设备及介质 | |
CN111563902A (zh) | 一种基于三维卷积神经网络的肺叶分割方法及系统 | |
CN107545263B (zh) | 一种物体检测方法及装置 | |
CN111145174A (zh) | 基于图像语义特征进行点云筛选的3d目标检测方法 | |
CN111640125A (zh) | 基于Mask R-CNN的航拍图建筑物检测和分割方法及装置 | |
CN112488025B (zh) | 基于多模态特征融合的双时相遥感影像语义变化检测方法 | |
CN114820579A (zh) | 一种基于语义分割的图像复合缺陷的检测方法及系统 | |
CN116342600B (zh) | 胸腺瘤组织病理学图像中细胞核的分割方法 | |
CN112132827A (zh) | 病理图像的处理方法、装置、电子设备及可读存储介质 | |
WO2024055530A1 (zh) | 一种图像的目标检测方法、系统、设备及存储介质 | |
CN112800955A (zh) | 基于加权双向特征金字塔的遥感影像旋转目标检测方法及系统 | |
CN114913493A (zh) | 一种基于深度学习的车道线检测方法 | |
CN113240665A (zh) | 一种基于深度学习的工业自动表面缺陷检测方法 | |
CN110659601A (zh) | 基于中心点的深度全卷积网络遥感图像密集车辆检测方法 | |
CN115984238A (zh) | 一种基于深度神经网络的电网绝缘子缺陷检测方法及系统 | |
CN115587964A (zh) | 一种基于熵筛选的伪标签交叉一致性变化检测方法 | |
CN117474796B (zh) | 一种图像生成方法、装置、设备及计算机可读存储介质 | |
CN113378642B (zh) | 一种对农村违法占地建筑物进行检测的方法 | |
CN114359269A (zh) | 基于神经网络的虚拟食品盒缺陷生成方法及系统 | |
CN117727046A (zh) | 新型山洪前端仪器仪表读数自动识别方法及系统 | |
CN116993730B (zh) | 一种基于8k图像的裂缝检测方法 | |
Zhang et al. | License plate recognition model based on CNN+ LSTM+ CTC | |
CN116778164A (zh) | 一种基于多尺度结构改进DeeplabV3+网络的语义分割方法 | |
CN116912625A (zh) | 一种基于先验缺陷特征与sspcab注意力机制的数据增强方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |