CN116563626B

CN116563626B - 钢桥螺栓锈蚀率的预测方法

Info

Publication number: CN116563626B
Application number: CN202310507383.0A
Authority: CN
Inventors: 李枝军; 邵鹏; 严锴; 徐秀丽; 李雪红
Original assignee: Nanjing Gongda Traffic Technology Co ltd; Suzhou Port And Shipping Development Center; Nanjing Tech University
Current assignee: Nanjing Gongda Traffic Technology Co ltd; Suzhou Port And Shipping Development Center; Nanjing Tech University
Priority date: 2023-05-06
Filing date: 2023-05-06
Publication date: 2024-07-26
Anticipated expiration: 2043-05-06
Also published as: CN116563626A

Abstract

本发明公开一种钢桥螺栓锈蚀率的预测方法，包括：对拍摄的图像进行预处理；将处理后的图像送入TWS算法中，通过不同的锈蚀程度的RGB值的差异，融合机器学习算法，实现对锈蚀颜色阈值分割，识别出轻微、中度、严重锈蚀区域；对识别后的图像的相应锈蚀区与其他区域二值化处理，计算整体锈蚀率；将自然锈蚀过程中的环境参数数据作为自变量，轻微锈蚀率、中度锈蚀率、严重锈蚀率、整体锈蚀率作为因变量输入到随机森林算法中，构建随机森林模型，输入影响因素的含量，预测各阶段的锈蚀率。本发明利用RGB阈值分割筛分螺栓相近的锈蚀颜色，提取锈蚀区域，并利用随机森林将钢桥螺栓锈蚀率与自然环境建立相关性，解决钢桁架桥节点螺栓难检测、难评价的困顿。

Description

钢桥螺栓锈蚀率的预测方法

技术领域

本发明涉及机器学习领域，特别是涉及一种基于Weka和随机森林实现钢桥螺栓锈蚀率的预测方法。

背景技术

螺栓作为钢桥中的重要组成部分，其安全性的保障一直都是桥梁健康监测的重点内容之一。高强螺栓作为钢桁架桥节点连接的关键零件，其锈蚀、脱落对节点的受力的改变一直以来都是研究的难点内容。

现有的方案是利用锈蚀电流或者质量法来实现对锈蚀程度的评判工作，且锈蚀的重点更多的关注于钢板部分，针对上亿的螺栓的锈蚀评价，并未出现针对性的方案，并不适用于采取锈蚀电流的方法，螺栓的锈蚀具有更复杂的桥梁自然环境和更大的随机性与非线性。

发明内容

有鉴于此，本发明的目的在于提供一种钢桥螺栓锈蚀率的预测方法，该方法适应复杂的自然环境，能够为钢桥螺栓锈蚀提供一种可预测的评价方法。

本发明提供一种钢桥螺栓锈蚀率的预测方法，包括：

步骤S1：利用相机采集钢桥螺栓锈蚀的数据集；

步骤S2：对所述数据集的每张照片进行去背景处理，以得到形成仅剩目标螺栓的各张图像；

步骤S3：在仅剩目标螺栓的各张图像中，获取同时具有螺栓的轻度锈蚀、中度锈蚀和重度锈蚀的单张图像，对获取到的每张图像的螺栓的轻度、中度和重度锈蚀区域分别添加对应锈蚀程度分类的标注信息；

步骤S4：将含有锈蚀程度分类的标注信息的图像送入图像分割算法中，以对含有锈蚀程度分类的标注信息的图像中不同锈蚀程度区域的识别，训练出适合图像锈蚀程度分类的机器学习训练模型，并将图像中的锈蚀区域按照不同锈蚀程度分别用不同的颜色区分开，以得到RGB三色图；

步骤S5：将所述RGB三色图转换成对应的灰度图；

步骤S6：将所述灰度图的A类区域、B类区域和C类区域分别转换为对应的二值化图像，以得到三张A类区域、B类区域和C类区域的二值化图像；

步骤S7：基于数据集中每张照片对应的三张A类区域、B类区域和C类区域的二值化图像，得到每张照片对应的整体锈蚀率，将整体锈蚀率作为因变量；将各个自然环境因素作为自变量；

步骤S8：将自变量作为输入，并将因变量作为样本集，输入到随机森林算法中，构建随机森林模型，通过训练随机森林模型，给出各个自然环境因素的权重值；

步骤S9：根据各个自然环境因素的权重值的大小，去掉权重值较小的自然环境因素，修正剩余的自然环境因素的权重值，以更正后的随机森林模型；

步骤S10：向更正后的随机森林模型输入实际的自然环境因素数据，从随机森林模型获取预测出的螺栓对应的锈蚀率。

进一步的，上述钢桥螺栓锈蚀率的预测方法中，步骤S2，包括：

利用OpenCV库中的GrabCut算法，将数据集的每张照片分为前景和后景，对后景进行移除，形成仅剩目标螺栓的各张图像。

进一步的，上述钢桥螺栓锈蚀率的预测方法中，步骤S3：对获取到的每张图像的螺栓的轻度、中度和重度锈蚀区域分别添加对应锈蚀程度分类的标注信息，包括：

将RGB值为(105，105，105)及其周边预设范围波动值的区域或(255，235，181)及其周边预设范围波动值的区域，设置对应的标注信息为C类区域；

将RGB值为(150，75，0)及其周边预设范围波动值的区域或(230，190，20)及其周边预设范围波动值的区域，设置对应的标注信息为B类区域；

将RGB值为(165，42，42)及其周边预设范围波动值的区域或(210，180，140)及其周边预设范围波动值的区域，设置对应的标注信息为A类区域。

进一步的，上述钢桥螺栓锈蚀率的预测方法中，步骤S4，包括：

步骤S41，将含有锈蚀程度分类的标注信息的图像送入TWS图像分割算法中，以对含有锈蚀程度分类的标注信息的图像中不同锈蚀程度区域的识别，训练出适合图像锈蚀程度分类的机器学习模型，并将图像中的锈蚀区域按照不同锈蚀程度分别用红、绿和蓝三种不同的颜色区分开，以得到RGB三色图，其中，红色代表A类区域、绿色代表B类区域、蓝色代表C类区域。

进一步的，上述钢桥螺栓锈蚀率的预测方法中，步骤S41，将含有锈蚀程度分类的标注信息的图像送入TWS图像分割算法中，包括：

取含有锈蚀程度分类的标注信息单张图像中的高斯噪声，使同一锈蚀锈蚀程度的像素值更加平滑，其二维高斯公式如下式(2)：

式中：

G_σ——图像高斯模糊的权重值；

(x,y)——像素点的位置；

σ——方差；

高斯模糊时采用不同的σ参数，σ等于σ_min，2σ_min，4σ_min，…，2^n-1σ_min，其中，2^n-1σ_min≤σ_max，使用高斯核执行5个单独的卷积，形成5张具有不同σ值的图像F；

将5张具有不同σ值的图像F，利用Sobel算子进一步做边缘检测，Sobel算子通过计算每个像素点处图像强度梯度的近似值，其公式如下式(3)：

P_h＝K_h*P,P_v＝K_v*P (4)

式中：

K_h、K_v——Sobel水平边缘检测矩阵与垂直边缘检测矩阵；

P_h、P_v——水平方向与垂直方向梯度幅值；

P_m——计算出的图像强度梯度的近似值；

通过上述操作，得到5张具有边缘特征的图像G；

同时，对图像F进行一个高斯差分处理，其中m在图像F中，用任意一个减去另一个，如式(6)：

式中：

DoG——像素点的高斯差分后的像素值；

f(x,y)——原图像的像素点的像素值；

g(x,y)——高斯模糊后的像素值。

经过高斯差分处理后产生10张具有特征的图像H；

将5张图像F、5张图像G和10张图像，全部送入TWS图像分割算法中训练。

进一步的，上述钢桥螺栓锈蚀率的预测方法中，步骤S5，包括：

将8bit下的RGB三色图转化为8bit下的灰度图，RGB三色图中每个像素点的转换公式参照如式(1)：

P＝Gray＝R*0.299+G*0.587+B*0.114 (1)

式中：

P——表示转化后的灰度值；

R、G、B——分别表示8bit下的红、绿、蓝、单通的像素值。

进一步的，上述钢桥螺栓锈蚀率的预测方法中，步骤S6，包括：

根据灰度图，利用imageJ中的threshold()函数模块设置交互式阈值上限与下限中的，以灰度阈值区间(0,30)作为C类区域的二值化条件、以灰度阈值区间(30,77)作为A类区域的二值化条件和以灰度阈值区间(77，151)作为B类区域的二值化条件，在各自区域的灰度阈值区间的部分设置为白色，灰度值为0，剩余部分设置为黑色，灰度值为255，得到三张A类区域、B类区域和C类区域的二值化图像。

进一步的，上述钢桥螺栓锈蚀率的预测方法中，步骤S7，包括：

拾取上述三张A类区域、B类区域和C类区域的二值化图像中的白色锈蚀区域的面积，计算锈蚀率I_A、I_B、I_C，得到不同锈蚀程度的锈蚀率，锈蚀率I_A、I_B、I_C之和即为整体锈蚀率I，利用所述机器学习训练模型，将整体锈蚀率作为因变量；

通过前期环境监测站记录，采集一年内钢桥螺栓周围的自然环境中的降雨量状态、温度、相对湿度、NO₂、CO、SO₂、O₃、Cl离子和PM2.5的自然环境数据，将自然环境数据作为自变量；

采集三张A类区域、B类区域和C类区域的二值化图像对应的钢桥螺栓周围的自然环境中的降雨量状态、温度、相对湿度、NO₂、CO、SO₂、O₃、Cl-离子和PM2.5的自然环境因素，将自然环境因素作为自变量。

进一步的，上述钢桥螺栓锈蚀率的预测方法中，步骤S8，训练随机森林模型，包括：

首先，随机森林算法模型的输入是以自然环境因素为自变量，整体锈蚀率为因变量的数组作为样本集，即D＝{(x₁,y₁),(x₂,y₂),...(x_m,y_m)}，其中，D代表样本集，x_m表示自然环境因素数据，是一个多维的数据，y_m代表整体锈蚀率I，通过弱分类器迭代T次，输出为最终的强分类器f(x)。

其次，对于t＝1,2...,T，取T＝100次，对所述样本集按照训练集：验证集＝8:2设置，对训练集进行第100次随机采样，共采集100次，得到包含样本的采样集D₁₀₀；

然后，用采样集D₁₀₀训练100个决策树模型Gm(x)，在训练决策树模型的节点的时候，在节点上所有的样本特征中选择一部分样本特征，在这些随机选择的一部分样本特征中选择一个最优的特征来做决策树的左右子树划分；由这100个分类和决策树子空间构成随机森林模型，在每个决策树子空间中平均训练数据的输出的锈蚀率I_pre；

最后，输入验证集进行随机验证，预测出的锈蚀率I_pre，对训练样本和预测样本的准确性的评价方法采取R²计算，如式(7)所示，或按照RMSE评估，如式(8)所示；基于R²计算或RMSE评估，得到评估较好的随机森林模型：

其中：

N——数据集的总数；

和y_n——分别表示第n个样本的预测出的锈蚀率I_pre和真实值；

——所有样本的真实值的平均值；

RMSE——均方根误差；

R——标准误差。

本发明的有益效果是：

传统的方法是利用锈蚀电流或锈蚀前后的质量差异来表征锈蚀程度，且桥梁领域集中于钢板或者钢筋，本发明突破了传统的锈蚀评价方法和领域，对钢桥的高强螺栓锈蚀评价方法中，首次采用锈蚀率来评价其锈蚀程度，创新性的提出了利用锈蚀程度RGB值的差异性，基于Java环境下，使用像素点进行颜色阈值分割的学习分类，拾取锈蚀率，并创新性的将锈蚀率首次作为因变量与自变量(自然环境中的降雨量状态、温度、相对湿度、NO₂、CO、SO₂、O³、PM2.5数据)送入随机森林算法中，构建RF模型，建立起锈蚀率与自然环境之间的非线性关系，通过随机森林模型，给定环境条件，预测出螺栓锈蚀的的速率，达到钢桥螺栓锈蚀率的评价目的，本发明具有更好的泛用性和鲁棒性。

附图说明

图1为本发明一实施例的整体流程示意图；

图2为本发明一实施例的Trainable Weka Segmentation的原理步骤图；

图3为本发明一实施例的RF模型图；

图4为本发明一实施例的CART决策树弱模型训练图。

具体实施方式

如何防止螺栓的锈蚀病害，使得钢桁架桥保持原有的力学性能是目前本领域的研究重点，了解自然环境下的钢桥螺栓锈蚀规律及其评价方法有助于桥梁工程师对更加准确地对桥梁节点力学性能的评估，在结构健康监测中，有助于更加准确的掌握桥梁的健康状况及其全寿命周期的节点特性。开发研究螺栓锈蚀的评价方法，填补国内螺栓锈蚀病害评价指标方向的空白，推动计算机视觉、智能化方法在桥梁结构健康监测方向的发展，实现学科之间的行业交叉，助推产业升级，监测模式的智能化升级，从病后诊治到病前预估，实现提早预测、提前发现、提前更换的最终目标。

随机森林(RF)，是机器学习领域中的一种有监督式学习方式。

RGB是图片的颜色通道，任何图片都可以看做由红、绿、蓝三种颜色的叠加。

Trainable Weka Segmentation，是一种基于Java环境下的，通过基于像素点进行机器学习的方法。

本发明包括：对拍摄的图像进行预处理，主要有背景分割、均值滤波、图像均衡化，消除噪点及光照对图像的影响，提取需要的螺栓部分；将处理后的图像送入TrainableWeka Segmentation中，通过不同的锈蚀程度的RGB值的差异，融合机器学习算法，实现对锈蚀的颜色阈值分割，识别出轻微锈蚀、中度锈蚀、严重锈蚀区域；对识别后的图像采取8bit转换，使相应锈蚀区与其他区域二值化处理，将分别计算出相应区域的面积比，之和即为整体锈蚀率；将自然锈蚀过程中的环境参数，即降雨量状态、温度、相对湿度、NO₂、CO、SO₂、O³、Cl^-离子、PM2.5等数据作为自变量，轻微锈蚀率、中度锈蚀率、严重锈蚀率、整体锈蚀率分别作为因变量输入到随机森林算法中，构建随机森林模型，拟合各种因素与锈蚀率之间的曲线关系，得出锈蚀的评价模型并部署，输入影响因素的含量，即可预测各阶段的锈蚀率。本发明首次利用RGB阈值分割筛分螺栓相近的锈蚀颜色，提取锈蚀区域，并首次利用随机森林将钢桥螺栓锈蚀率与自然环境建立相关性，填补国内在螺栓锈蚀评价方法与指标领域的空白，解决国内钢桁架桥节点螺栓难检测、难评价的困顿，给予桥梁工程人员适时判断螺使用状态的新的思路，并进一步为评价桥梁结构健康状况提供参考。

如图1所示，本发明的一种钢桥螺栓锈蚀率的预测方法，包括以下步骤：

步骤S1：数据采集。利用相机采集钢桥螺栓锈蚀的数据集；

优选的，可以采用时间跨度可以为1年，以7天为采集间断点，对螺栓锈蚀照片进行拍摄采集，形成具有时间序列的周期数据作为所述钢桥螺栓锈蚀的数据集，本方案中所用照片可以均为4608×3456彩色图像，对图片数据集进行整理编号，形成使用数据集。

步骤S2：对所述数据集的每张照片进行去背景处理，以消除背景对机器学习过程的影响；

具体为，利用OpenCV库中的GrabCut算法，将数据集的每张照片分为前景和后景，对后景进行移除，形成仅剩目标螺栓的各张图像。

步骤S3：在仅剩目标螺栓的各张图像中，获取单张图像中同时具有螺栓的轻度锈蚀、中度锈蚀和重度锈蚀的图像，对获取到的每张图像的螺栓的轻度、中度和重度锈蚀区域分别添加对应锈蚀程度分类的标注信息；

在此，该标注信息是基于彩色图像像素点的标注，标注时，对锈蚀程度分类的划分来源如下：

根据DS/EN ISO 8501-1-2007中对锈蚀的等级划分，并查询相关RGB值，得出：

钢桥高强螺栓的轻度锈蚀表现为暗灰色或者淡黄色，其RGB值(105，105，105)与(255,235,181)；

中度锈蚀表现为褐色或者棕黄色，其RGB值(150,75,0)与(230,190,20)；

重度锈蚀表现为棕色或者棕褐色，其RGB值为(165,42,42)与(210,180,140)；

考虑到同种锈蚀颜色的正常波动范围，标注锈蚀区域时，在暗灰色、褐色或者棕黄色、棕色或者棕褐色各自周边预设范围波动的值均视为各自所属的锈蚀分类；

标注时，标注类别具体分为A、B、C三种，其中：

C：轻度锈蚀。表现为暗灰色或者淡黄色，属于锈蚀刚发生初期，仅有少量颜色较浅的锈蚀。

B：中度锈蚀。表现为棕黄色或者褐色，并且伴有少量的点蚀情况，属于锈蚀发展的中期，表面大部分被锈蚀覆盖。

A：重度锈蚀。表现为棕色或者棕褐色，且伴有大量的点蚀情况，表面基本上锈蚀，向深色转化，氧化层全面剥离。

标注完成后，得到在单张图像上含有不同类别的锈蚀区域的标注信息。

步骤S4：将含有锈蚀程度分类的标注信息的图像送入图像分割算法如TWS算法(Trainable Weka Segmentation)中，以对含有锈蚀程度分类的标注信息的图像中不同锈蚀程度区域的识别，训练出适合图像锈蚀程度分类的机器学习训练模型，并将图像中的锈蚀区域按照不同锈蚀程度分别用红、绿和蓝三种不同的颜色区分开，以得到RGB三色图，其中，红色代表A类区域、绿色代表B类区域、蓝色代表C类区域；

在此，Trainable Weka Segmentation是在基于Java环境下，利用机器学习实现基于颜色阈值的图像分割，通过对像素点的学习，实现对不同锈蚀程度区域的识别，训练出适合图像锈蚀程度分类的机器学习模型，并将该图片的锈蚀区域按照不同的锈蚀程度用不同的颜色区分开，以红色代表A类区域、绿色代表B类区域、蓝色代表C类区域，保存该训练结果。

步骤S5：将所述RGB三色图转换成对应的灰度图；

具体的上述训练结果呈现的是8bit下的RGB三色图，为了便于对单一锈蚀程度进行二值化处理，需将其转化为8bit下的灰度图，RGB三色图中每个像素点的转换公式参照如式(1)：

P＝Gray ＝ R*0.299 + G*0.587 + B*0.114 (1)

式中：

P——表示转化后的灰度值；

R、G、B——分别表示8bit下的红、绿、蓝、单通的像素值；

按照公式计算，转换后的A区域的每个像素点的灰度值为76，B区域的每个像素点的灰度值为150，C区域的每个像素点的灰度值为29，形成一张具有目标区域的灰度图片。

步骤S6：将所述灰度图的A类区域、B类区域和C类区域分别转换为对应的二值化图像；

具体的，根据灰度图，利用imageJ中的threshold()函数模块设置交互式阈值上限与下限中的，以灰度阈值区间(0,30)作为C类区域的二值化条件、以灰度阈值区间(30,77)作为A类区域的二值化条件和以灰度阈值区间(77，151)作为B类区域的二值化条件，在各自区域的灰度阈值区间的部分设置为白色，灰度值为0，剩余部分设置为黑色，灰度值为255，得到三张A类区域、B类区域和C类区域的二值化图像。

步骤S7：分别拾取上述三张A类区域、B类区域和C类区域的二值化图像中的白色锈蚀区域的面积，计算锈蚀率I_A、I_B、I_C，得到不同锈蚀程度的锈蚀率，锈蚀率I_A、I_B、I_C之和即为整体锈蚀率I，利用S4中的机器学习训练模型，处理数据集的所有图片，重复S5、S6步骤得到数据集每张图片的整体锈蚀率，将整体锈蚀率作为因变量；并且通过前期环境监测站记录，采集三张A类区域、B类区域和C类区域的二值化图像对应的钢桥螺栓周围的自然环境中的降雨量状态、温度、相对湿度、NO₂、CO、SO₂、O₃、Cl-离子和PM2.5的自然环境数据，将自然环境数据作为自变量。形成以环境数据为自变量的输入，以锈蚀率为因变量的输出数据。

步骤S8：将自变量作为输入，并将因变量作为样本集，输入到随机森林算法中，构建随机森林模型，通过训练随机森林模型，给出各个自然环境因素的权重，即重要性系数。

在此，随机森林算法是一种机器学习算法，对非线性数据集具有很好的拟合能力，可以通过训练，找出自然环境因素与锈蚀之间的非线性关系。通过训练随机森林模型，给出所有自然环境因素的权重值，即重要性系数。

步骤S9：根据重要性系数可知，温度、湿度、降雨量状态与离子浓度是影响最大的，去掉影响系数最小的PM2.5、O₃的值，修正其他权重值，得到全年螺栓受各种自然因素影响的规律，形成更正后的随机森林模型。

步骤S10：向更正厚度随机森林模型输入实际的自然环境因素数据，从随机森林模型获取预测出的螺栓对应的锈蚀率。

进一步地，在步骤S4中，Trainable Weka Segmentation是基于Java环境下，将一系列机器学习算法与一组选定的图像特征相结合，以产生基于像素分割的方法，具体见附图2所示，在送入算法训练之前，需要对标注的图像进行一定的处理，以产生具有明显特征的图像，每一次处理均会产生一个图像，最终形成不同处理的图像堆栈，图像处理的主要方法有高斯模糊处理、Sobel滤波器、高斯差异处理特征。

首先取含有锈蚀程度分类的标注信息单张图像中的高斯噪声，使同一锈蚀锈蚀程度的像素值更加平滑，其二维高斯公式如下式(2)：

式中：

G_σ——图像高斯模糊的权重值；

(x,y)——像素点的位置；

σ——方差；

高斯模糊时采用不同的σ参数。σ通常等于σ_min，2σ_min，4σ_min，…，2^n-1σ_min，其中2^n-1σ_min≤σ_max。默认情况下σ_min＝1，σ_max＝16，因此n＝5。半径越大，图像变得越模糊，直到像素都是均匀的。使用高斯核执行5个单独的卷积，形成5张具有不同σ值的图像F。

其次，将前述处理的图利用Sobel算子进一步做边缘检测，其目的是使得各种锈蚀程度之间的边缘更加界限分明，Sobel算子通过计算每个像素点处图像强度梯度的近似值，其公式如下式(3)：

P_h＝K_h*P,P_v＝K_v*P (4)

式中：

K_h、K_v——Sobel水平边缘检测矩阵与垂直边缘检测矩阵；

P_h、P_v——水平方向与垂直方向梯度幅值；

P_m——计算出的图像强度梯度的近似值。

通过上述操作，得到5张具有边缘特征的图像G；

同时，对高斯模糊后的图像F进行一个高斯差分处理，其目的是检测图像多尺度下的细节结构，使得锈蚀特征更加准确突出，其原理是在高斯模糊后的图像中，用任意一个减去另一个，具体如式(6)：

式中：

DoG——像素点的高斯差分后的像素值；

f(x,y)——原图像的像素点的像素值；

g(x,y)——高斯模糊后的像素值。

因σ值通常是变化的，因此经过高斯差分后产生n(n-1)/2个图像，即产生10个具有特征的图像H，将前述处理的具有图像特征的20张图片/(图像F共5张、图像G共5张、图像H共10张)全部送入图像分割算法中训练。

进一步地，在步骤S8中，进行随机森林算法模型训练的步骤是：

首先，随机森林算法模型的输入是以自然环境因素为自变量，螺栓的整体锈蚀率为因变量的数组作为样本集，即D＝{(x₁,y₁),(x₂,y₂),...(x_m,y_m)}，其中D代表样本集，x_m表示自然环境影响因素数据，是一个多维的数据，y_m代表整体锈蚀率I，通过弱分类器迭代T次，输出为最终的强分类器f(x)。

其次，对于t＝1,2...,T，具体次数由训练效果确定，在本项目中，取T＝100次，对上述输入的样本集按照训练集：验证集＝8:2设置，对训练集进行第100次随机采样，共采集100次，得到包含样本的采样集D₁₀₀；

然后，用采样集D₁₀₀训练100个决策树模型Gm(x)，在训练决策树模型的节点的时候，在节点上所有的样本特征中选择一部分样本特征，在这些随机选择的部分样本特征中选择一个最优的特征来做决策树的左右子树划分。RF模型由这100个分类和决策树(CART)子空间构成，在每个子空间中平均训练数据的输出的锈蚀率I_pre，对输出的锈蚀率求取平均值来避免单个决策树模型过拟合或者不稳定的影响，形成由多个弱模型组成的一个强训练模型。

最后，输入验证集数据的x进行随机验证，预测出的锈蚀率I_pre，我们对训练样本和预测样本的准确性的评价方法采取R²计算，如式(7)所示，也可按照RMSE评估，如式(8)所示，评估较好的模型，即可得出不同输入对整体锈蚀率I的影响：

其中：

N——数据集的总数；

——所有样本的真实值的平均值；

RMSE——均方根误差；

R——标准误差。

通过验证，R²接近为1，RMSE较小，预测的I_pre与实际的y_n基本吻合，说明随机森林模型的拟合能力较好，可作为评价钢桥螺栓锈蚀率的预测模型，部署该随机森林模型，作为钢桥螺栓锈蚀率的评价方法，随机森林具体原理见图3、图4所示。

本发明的有益效果是：

本发明未详述之处，均为本领域技术人员的公知技术。

以上详细描述了本发明的具体实施过程。应当理解，本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此，凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在由权利要求书所确定的保护范围内。

Claims

1.一种钢桥螺栓锈蚀率的预测方法，其特征在于，包括：

步骤S1：利用相机采集钢桥螺栓锈蚀的数据集；

步骤S4：将含有锈蚀程度分类的标注信息的图像送入基于机器学习的图像分割算法中以训练模型，以对含有锈蚀程度分类的标注信息的图像中不同锈蚀程度区域的识别，训练出适合图像锈蚀程度分类的机器学习训练模型，并将图像中的锈蚀区域按照不同锈蚀程度分别用不同的颜色区分开，以得到RGB三色图；

步骤S5：将所述RGB三色图转换成对应的灰度图；

步骤S6：将所述灰度图的A类区域、B类区域和C类区域分别转换为对应的二值化图像，以分别得到A类区域、B类区域和C类区域的共三张二值化图像；

步骤S7：基于数据集中每张照片对应的A类区域、B类区域和C类区域的二值化图像，得到每张照片对应的整体锈蚀率，将整体锈蚀率作为因变量；将各个自然环境因素作为自变量；

步骤S8：将自变量和因变量作为样本集，输入到随机森林算法中，构建随机森林模型，通过训练随机森林模型，给出各个自然环境因素的权重值；

步骤S10：向更正后的随机森林模型输入实际的自然环境因素数据，从随机森林模型获取预测出的螺栓对应的锈蚀率；

步骤S3：对获取到的每张图像的螺栓的轻度、中度和重度锈蚀区域分别添加对应锈蚀程度分类的标注信息，包括：

将RGB值为(105，105，105)及其周边预设范围波动值的区域，或RGB值为(255，235，181)及其周边预设范围波动值的区域，设置对应的标注信息为C类区域；

将RGB值为(150，75，0)及其周边预设范围波动值的区域，或RGB值为(230，190，20)及其周边预设范围波动值的区域，设置对应的标注信息为B类区域；

将RGB值为(165，42，42)及其周边预设范围波动值的区域，或RGB值为(210，180，140)及其周边预设范围波动值的区域，设置对应的标注信息为A类区域。

2.如权利要求1所述的钢桥螺栓锈蚀率的预测方法，其特征在于，步骤S2，包括：

3.如权利要求1所述的钢桥螺栓锈蚀率的预测方法，其特征在于，步骤S4，包括：

步骤S41，将含有锈蚀程度分类的标注信息的图像送入基于weka训练的图像分割方法中，以对含有锈蚀程度分类的标注信息的图像中不同锈蚀程度区域的识别，训练出适合图像锈蚀程度分类的机器学习模型，并将图像中的锈蚀区域按照不同锈蚀程度分别用红、绿和蓝三种不同的颜色区分开，以得到RGB三色图，其中，红色代表A类区域、绿色代表B类区域、蓝色代表C类区域。

4.如权利要求3所述的钢桥螺栓锈蚀率的预测方法，其特征在于，步骤S41，将含有锈蚀程度分类的标注信息的图像送入基于weka训练的图像分割方法中，包括：

式中：

G_σ表示图像高斯模糊的权重值；

(x,y)表示像素点的位置；

σ表示方差；

P_h＝K_h*P,P_v＝K_v*P#(4)

式中：

K_h、K_v表示Sobel水平边缘检测矩阵与垂直边缘检测矩阵；

P_h、P_v表示水平方向与垂直方向梯度幅值；

P_m表示计算出的图像强度梯度的近似值；

通过上述操作，得到5张具有边缘特征的图像G；

同时，对图像F进行一个高斯差分处理，其中，在5张具有不同σ值的图像F中，用其中一张图像F的高斯模糊后的像素值减去另一张图像F的高斯模糊后的像素值，如式(6)：

式中：

DoG表示像素点的高斯差分后的像素值；

f(x,y)表示原图像的像素点的像素值；

g₁(x,y)表示其中一张图像F高斯模糊后的像素值，g₂(x,y)表示另一张图像F高斯模糊后的像素值；

经过高斯差分处理后产生10张具有特征的图像H；

为其中一张图像F的图像高斯模糊的权重值，为另一张图像F的图像高斯模糊的权重值；

将5张图像F、5张图像G和10张图像H，全部送入TWS图像分割算法中训练。

5.如权利要求4所述的钢桥螺栓锈蚀率的预测方法，其特征在于，步骤S5，包括：

P＝Gray＝R*0.299+G*0.587+B*0.114#(1)

式中：

P表示转化后的灰度值；

R、G、B分别表示8bit下的红、绿、蓝、单通的像素值。

6.如权利要求5所述的钢桥螺栓锈蚀率的预测方法，其特征在于，步骤S6，包括：

根据灰度图，利用imageJ中的threshold()函数模块设置交互式阈值上限与下限，以灰度阈值区间(0,30)作为C类区域的二值化条件、以灰度阈值区间(30,77)作为A类区域的二值化条件和以灰度阈值区间(77，151)作为B类区域的二值化条件，在各自区域的灰度阈值区间的部分设置为白色，灰度值为0，剩余部分设置为黑色，灰度值为255，得到三张A类区域、B类区域和C类区域的二值化图像。

7.如权利要求6所述的钢桥螺栓锈蚀率的预测方法，其特征在于，步骤S7，包括：

拾取所述A类区域、B类区域和C类区域的二值化图像中的白色锈蚀区域的面积，计算锈蚀率I_A、I_B、I_C，得到不同锈蚀程度的锈蚀率，锈蚀率I_A、I_B、I_C之和即为整体锈蚀率I，利用所述机器学习训练模型，将整体锈蚀率作为因变量；

采集A类区域、B类区域和C类区域的二值化图像对应的钢桥螺栓周围的自然环境中的降雨量状态、温度、相对湿度、NO₂、CO、SO₂、O₃、Cl离子和PM2.5的自然环境数据，将自然环境因素作为自变量。

8.如权利要求6所述的钢桥螺栓锈蚀率的预测方法，其特征在于，步骤S8，训练随机森林模型，包括：

首先，随机森林算法模型的输入是以自然环境因素为自变量，整体锈蚀率为因变量的数组作为样本集，即D＝{(x₁,y₁),(x₂,y₂),...(x_m,y_m)}，其中，D代表样本集，x_m表示自然环境因素数据，是一个多维的数据，y_m代表整体锈蚀率I，通过弱分类器迭代T次，输出为最终的强分类器f(x)；

然后，用采样集D₁₀₀训练100个决策树模型Gm(x)，在训练决策树模型的节点的时候，在节点上所有的样本特征中选择一部分样本特征，在这些随机选择的一部分样本特征中选择一个最优的特征来做决策树的左右子树划分；由这100个分类和决策树子空间构成随机森林模型，在每个决策树子空间中平均训练数据输出的锈蚀率I_pre；

最后，输入验证集进行随机验证，预测出锈蚀率I_pre，对训练样本和预测样本的准确性的评价方法采取R²计算，如式(7)所示，或按照RMSE评估，如式(8)所示；基于R²计算或RMSE评估，得到评估较好的随机森林模型：

其中：

N表示数据集的总数；

和y_n分别表示第n个样本的预测出的锈蚀率I_pre和真实值；表示所有样本的真实值的平均值；

RMSE表示均方根误差；

R表示标准误差。