CN116993730A

CN116993730A - 一种基于8k图像的裂缝检测方法

Info

Publication number: CN116993730A
Application number: CN202311249742.3A
Authority: CN
Inventors: 刘征; 宋小民; 王曼; 邓义斌; 李子清; 郑慧明
Original assignee: Sichuan Xinshi Chuangwei Ultra High Definition Technology Co ltd
Current assignee: Sichuan Xinshi Chuangwei Ultra High Definition Technology Co ltd
Priority date: 2023-09-26
Filing date: 2023-09-26
Publication date: 2023-11-03
Anticipated expiration: 2043-09-26
Also published as: CN116993730B

Abstract

本发明公开了一种基于8K图像的裂缝检测方法，属于裂缝检测技术领域。所述裂缝检测方法包括：构建裂缝检测模型；对所述裂缝检测模型进行训练；将待检测图像输入所述裂缝检测模型进行检测，得到裂缝检测结果；其中，所述裂缝检测模型包括：双边滤波模块，用于对所述待检测图像进行降噪滤波；编码路径，用于对降噪滤波后的所述待检测图像进行特征提取，生成特征图；注意力模块，用于对编码路径输出的所述特征图进行特征权重调整；解码路径，用于对所述注意力模块输出的特征图执行卷积和上采样运算，得到裂缝预测图像。本发明减少了模型的参数量和神经网络的复杂度。

Description

一种基于8K图像的裂缝检测方法

技术领域

本发明属于裂缝检测技术领域，特别是涉及一种基于8K图像的裂缝检测方法。

背景技术

在传统的路面裂缝检测方法中，通常需要耗费大量人力和时间，相较之下，现今已经出现了多种自动化路面裂缝数据采集和检测方法。采用现代道路智能检测方法不仅更高效，而且获取的数据更为丰富和准确，同时成本也更为低廉。在数据采集方面，除了道路智能检测车，还包括无人机等。而在路面裂缝检测方法方面，数字图像处理、超声波检测和射线扫描等方法均得到应用。虽然基于传统图像处理方法的自动化道路裂缝检测系统相对于人工检测精度更高成本更低，但是这种方法在处理裂缝图像时面临一些问题。裂缝图像往往具有强烈的噪声，同时前景和背景边界有时不清晰，这可能导致提取出的裂缝被中断，且系统容易将非裂缝区域错误分类为裂缝。为应对这些挑战，基于深度学习的道路裂缝检测已成为学术界和工业界的主流研究方法。深度学习具有出色的抗噪能力和自动特征提取能力，能够在复杂图像中识别特定信息和特征，可以为道路裂缝检测带来更精确的结果。然而，在应对灰度不均匀、图像质量不稳定等问题时，仍需要进一步的研究和创新。

为了解决传统裂缝检测方法的限制，研究者们正在采用一些前沿技术进行改进。改进方法包括对网络结构的优化，例如改进的Mask R-CNN和改进的Transformer模块。另外，研究人员还尝试将不同的方法融合起来，例如将CNN与支持向量机（SVM，SupportVector Machine）相结合，或将VGG16与Faster R-CNN相结合。但这些方法在处理8K图像时也会遇到特征丢失，检测速率变慢等挑战，比如，由于图像分辨率过高，导致更多噪声干扰目标区域，使目标纹理不清晰，增加网络训练的难度，并需要更深层次的网络才可以学习到目标裂缝特征，这会带来更多的参数量和计算量，消耗更多资源。此外，直接处理原始的8K图像也会影响网络推理速度和系统开销。

发明内容

本发明的目的在于克服现有技术的不足，提供一种基于8K图像的裂缝检测方法。

本发明的目的是通过以下技术方案来实现的：一种基于8K图像的裂缝检测方法，包括：

构建裂缝检测模型；

对所述裂缝检测模型进行训练；

将待检测图像输入所述裂缝检测模型进行检测，得到裂缝检测结果；

其中，所述裂缝检测模型包括：

双边滤波模块，用于对所述待检测图像进行降噪滤波；

编码路径，用于对降噪滤波后的所述待检测图像进行特征提取，生成特征图；

注意力模块，用于对编码路径输出的所述特征图进行特征权重调整；

解码路径，用于对所述注意力模块输出的特征图执行卷积和上采样运算，得到裂缝预测图像。

进一步地，对所述裂缝检测模型进行训练，包括：

获取若干张包含道路裂缝的原始8K图像；

对所述原始8K图像进行标注，生成真实标签数据集；

基于所述真实标签数据集对所述裂缝检测模型进行训练。

进一步地，获取若干张包含道路裂缝的原始8K图像，包括：

获取多种材质路面的视频影像；

按第一预设值的交叠比将所述视频影像的所有帧保存为原始8K图像；

从所有原始8K图像中筛选出包含道路裂缝的原始8K图像。

进一步地，所述第一预设值为5%-10%。

进一步地，对所述原始8K图像进行标注，生成真实标签数据集，包括：

对所述原始8K图像进行标注；

将标注后的原始8K图像由JSON格式转换为VOC格式，生成真实标签数据集。

进一步地，对所述原始8K图像进行标注，包括：

为所述原始8K图像标注目标名称、类别和大小。

进一步地，将待检测图像输入所述裂缝检测模型进行检测，得到裂缝检测结果，包括：

将待检测图像分块处理为多张样本图像；

将所述多张样本图像同时输入所述裂缝检测模型进行裂缝检测；

将所述多张样本图像的裂缝检测结果进行融合生成所述待检测图像的裂缝检测结果。

本发明的有益效果是：

（1）本发明采用改进的双边滤波算法对原始的8K图像有效地消除背景噪声，保留目标裂缝边缘信息，增强细节，使目标区域更加突出，采用轻量级CNN网络就可以准确的提取裂缝的关键特征，这样可以有效减少模型的参数量和神经网络的复杂度；

（2）本发明采用分块处理和融合方法，可以减少冗余的网络计算，提高内存效率，解决了传统推理过程导致的大量重复计算和资源浪费；将多个样本一起进行前向计算，从而共享相同的计算步骤，再将子区域的处理结果进行融合，在计算上节省了时间和资源；

（3）本发明通过将计算资源从CPU转移到GPU进行处理，可以加速深度学习模型的训练和推理过程，进一步提高裂缝检测的效率和性能。

附图说明

图1为本发明中裂缝检测方法的一种流程图；

图2为双边滤波时的一种示意图；

图3为分别采用高斯滤波和双边滤波对第一张原始图像进行处理后的效果图；

图4为分别采用高斯滤波和双边滤波对第二张原始图像进行处理后的效果图；

图5为分别采用高斯滤波和双边滤波对第三张原始图像进行处理后的效果图；

图6为网络训练过程中的一种示意图。

具体实施方式

下面将结合实施例，对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有付出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

参阅图1至图6，本发明提供一种基于8K图像的裂缝检测方法：

如图1所示，裂缝检测方法包括步骤S100至步骤S300。

步骤S100.构建裂缝检测模型。

所述裂缝检测模型包括双边滤波模块、编码路径、注意力模块和解码路径。

双边滤波模块用于对所述待检测图像进行降噪滤波。

以图2所示图像为例对双边滤波降噪的过程进行说明，将该图像看做是10*10的一张图像，图中的数字表示每个点的像素值；在图中存在一个5*5大小的滑动窗口，需要求出中心点灰度值146的新像素值。

首先遍历整个窗口，第一个遍历到的点是165，那么中心点与该点的空间域计算结果为：

式中，表示中心点与遍历到的点的空间域，/>为空间域标准差，e为自然常数。

然后第二，计算中心点与该点的值域结果：

式中，表示中心点与遍历到的点的值域，/>为值域标准差，e为自然常数。

最后遍历整个窗口，将窗口内每个像素点都与中心点建立联系，求出它们的空间域和值域的值，将空间域和值域的值相乘即得到每个点的权重Wp。遍历结束后，用每个点的权重Wp乘以该点的像素值I，并求和作为分子；将每个点的权重Wp相加作为分母，两者相除，即得到需要的新输出图像中心点的像素值。

空间域sigma（space）越大，图像越平滑；空间域越小，中心点权重越大，周围点权重越小，对图像的滤波作用越小，趋于零时，输出等同于原图。值域sigma（color）越大，边缘越模糊，极限情况为simga无穷大，值域系数近似相等，与高斯模板（空间域模板）相乘后可认为等效于高斯滤波。Sigma（color）越小，边缘越清晰，极限情况为simga无限接近0，与高斯模板相乘进行滤波的结果等效于源图像。本发明中双边滤波空间域和值域等参数最终确定为：diameter（直径）=25, sigma_color=100, sigma_space=100。

编码路径用于对降噪滤波后的所述待检测图像进行特征提取，生成特征图。

在一些实施例中，编码路径包括灵活的解码模块（FLD）。随着层级从深到浅，传统解码模块中特征图的尺寸逐渐增大，通道数保持不变。而 FLD 模块中特征图的通道数逐渐减小，可以平衡不同层的算量。同时，根据编码模块灵活调整解码模块中通道数，平衡编码模块和解码模块的算量，使得整个模型更加高效。

注意力模块用于对编码路径输出的所述特征图进行特征权重调整。

本实施例中使用PP-LiteSeg统一注意力模块（UAFM）来有效地加强特征表示，该模块包含空间注意力模块（b）和通道注意力模块（c）。空间注意力模块使用输入特征图的空间相互关系来生成权重α₁，表示空间维度不同像素点的重要性。通道注意力模块使用输入特征图的通道相互关系来生成权重α₂，表示不同通道的重要性。所以，UAFM 充分利用了输入特征的空间以及通道之间的关系，加强特征表示。

解码路径用于对所述注意力模块输出的特征图执行卷积和上采样运算，得到裂缝预测图像。

在一些实施例中，解码路径由金字塔池化模块构成，PP-LiteSeg 设计了一种简易金字塔池化模块（SPPM）。使用空间金字塔池化操作来融合特征图的信息，其中有三个全局池化算子，分别输出1*1、2*2、4*4尺寸的特征图；对小尺寸的特征图执行卷积和上采样运算，得到通道和尺寸相同的特征图；将上一步的输出进行相加，执行一个卷积运算后，得到最终的特征图。SPPM 模块减小了中间特征图的通道数、移除了跳跃连接、使用加法算子替换级联算子。

本实施例中的裂缝检测模型通过编码路径和解码路径提取低等级和高等级道路裂缝语义特征，并通过多尺度跨越连接将编码路径特征输入解码路径中，补充细节特征，通过预测模块检测路面图像中的裂缝。

步骤S200.对所述裂缝检测模型进行训练。

在一些实施例中，对所述裂缝检测模型进行训练，包括步骤S210至步骤S230。

步骤S210.获取若干张包含道路裂缝的原始8K图像。

例如，将8K摄像机调试相机视场与角度，确保获取数据清晰且覆盖范围广；采集不同材质的不同病害程度的路面原始影像，例如水泥路面、大理石路面等；以5%-10%的交叠比将所述视频影像的所有帧保存为原始8K图像；从所有原始8K图像中筛选出包含道路裂缝的原始8K图像。

步骤S220.对所述原始8K图像进行标注，生成真实标签数据集。

对所述原始8K图像进行标注，生成真实标签数据集，包括步骤S221和步骤S222。

步骤S221.对所述原始8K图像进行标注。

例如，通过百度飞桨图像标注工具EISeg对输入的图像进行标注（包括目标名称、类别、大小等），生成能被图像分割网络认识的数据信息。

步骤S222.将标注后的原始8K图像由JSON格式转换为VOC格式，生成真实标签数据集。

在一些实施例中，将真实标签数据集划分为训练集、验证集和测试集，其中，训练集:验证集:测试集=7:2:1。

步骤S230.基于所述真实标签数据集对所述裂缝检测模型进行训练。

在一些实施例中，使用GitHub开源的PaddleSeg框架和CUDA搭建基于GPU的模型训练和测试环境；通过比较不同模型检测性能和训练、预测效率，最终选用PP-liteseg作为最终模型；测试不同学习率和批次大小下模型性能，通过横向比较检测结果，采用540*480大小的图像块进行训练，设置batch_size=6，learning_rate= 0.01，iters=10000等超参数，batch size为批量大小，learning_rate为学习率，iters为迭代次数；迭代训练，设置模型每迭代500次进行一次结果打印，并保存最好的模型权重文件；模型加载，将训练好的深度学习模型加载到内存中，模型包含网络结构和相应的权重参数。

步骤S300.将待检测图像输入所述裂缝检测模型进行检测，得到裂缝检测结果。

在一些实施例中，将待检测图像输入所述裂缝检测模型进行检测，得到裂缝检测结果，包括：将待检测图像分块处理为多张样本图像；将所述多张样本图像同时输入所述裂缝检测模型进行裂缝检测；将所述多张样本图像的裂缝检测结果进行融合生成所述待检测图像的裂缝检测结果。

本实施例中对待检测图像进行分块处理，并对检测结果进行融合。分块处理：将待检测图像数据划分为小批次（batch），每个批次包含多张样本图像，采用batch size=4和batch size=8，这些批次的样本图像同时输入到模型中进行推理，可以充分利用硬件设备（如GPU）的并行计算能力，加快推理速度。同时，批处理推理还可以优化内存使用，减少了数据传输的开销。批处理包括前向传播：对于每个批次中的图像数据，执行前向传播操作。前向传播是指将输入数据通过深度学习模型的网络层，逐层计算输出结果的过程。这一步骤通过矩阵乘法和激活函数等运算实现。后处理：对于每个批次的输出结果，进行后处理操作。使用Softmax函数计算类别概率，并选择概率最高的类别作为最终预测结果。结果融合：将每个批次的预测结果整合起来，得到最终的道路裂缝检测结果。

本实施例提供的路面裂缝检测方法不仅能够确保高质量的检测结果，还能提升算法效率，实现了对8K图像道路裂缝的实时检测，从而推动了工程应用与行业落地。

表1给出了本实施例中裂缝检测模型的mIoU和Acc，其中mIoU为平均交并比，Acc为预测准确率。实验结果表明，本实施例所提出的采用双边滤波算法的模型在mIoU和Acc表现更好。

表1 无滤波与有滤波mIoU、Acc比较

表2给出了不采用分块批处理推理方法和采用分块批处理推理方法时的批次时间开销。结果显示，采用分块批处理推理方法的模型具有更短的运行时间。

表2 单样本推理与批处理推理速度比较

图3、图4和图5展示了三组截取的部分8K图像经过滤波后的效果。分辨率分别为368*640、540*480、2000*1125。其中左侧是原始输入图像，中间是采用传统高斯滤波后的图像，右侧则是经过本实施例的双边滤波处理后的图像。结果明确地显示，采用双边滤波的图像在噪音消除和裂缝细节显示方面均优于传统高斯滤波。

图6展示了网络训练过程中的损失曲线，其中Train表示训练，loss表示损失。位于上方的曲线L1代表了未采用双边滤波算法的模型收敛速度，而位于下方的曲线L2则表示采用了双边滤波算法的模型收敛速度。结果清晰地显示，采用双边滤波算法的模型收敛速度更快，进一步验证了本实施例方法的有效性。

以上所述仅是本发明的优选实施方式，应当理解本发明并非局限于本文所披露的形式，不应看作是对其他实施例的排除，而可用于各种其他组合、修改和环境，并能够在本文所述构想范围内，通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围，则都应在本发明所附权利要求的保护范围内。

Claims

1.一种基于8K图像的裂缝检测方法，其特征在于，包括：

构建裂缝检测模型；

对所述裂缝检测模型进行训练；

其中，所述裂缝检测模型包括：

双边滤波模块，用于对所述待检测图像进行降噪滤波；

2.根据权利要求1所述的一种基于8K图像的裂缝检测方法，其特征在于，对所述裂缝检测模型进行训练，包括：

获取若干张包含道路裂缝的原始8K图像；

对所述原始8K图像进行标注，生成真实标签数据集；

基于所述真实标签数据集对所述裂缝检测模型进行训练。

3.根据权利要求2所述的一种基于8K图像的裂缝检测方法，其特征在于，获取若干张包含道路裂缝的原始8K图像，包括：

获取多种材质路面的视频影像；

从所有原始8K图像中筛选出包含道路裂缝的原始8K图像。

4.根据权利要求3所述的一种基于8K图像的裂缝检测方法，其特征在于，所述第一预设值为5%-10%。

5.根据权利要求2所述的一种基于8K图像的裂缝检测方法，其特征在于，对所述原始8K图像进行标注，生成真实标签数据集，包括：

对所述原始8K图像进行标注；

6.根据权利要求2所述的一种基于8K图像的裂缝检测方法，其特征在于，对所述原始8K图像进行标注，包括：

为所述原始8K图像标注目标名称、类别和大小。

7.根据权利要求1所述的一种基于8K图像的裂缝检测方法，其特征在于，将待检测图像输入所述裂缝检测模型进行检测，得到裂缝检测结果，包括：

将待检测图像分块处理为多张样本图像；