CN116563626A - 钢桥螺栓锈蚀率的预测方法 - Google Patents

钢桥螺栓锈蚀率的预测方法 Download PDF

Info

Publication number
CN116563626A
CN116563626A CN202310507383.0A CN202310507383A CN116563626A CN 116563626 A CN116563626 A CN 116563626A CN 202310507383 A CN202310507383 A CN 202310507383A CN 116563626 A CN116563626 A CN 116563626A
Authority
CN
China
Prior art keywords
rust
image
corrosion
region
rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310507383.0A
Other languages
English (en)
Inventor
李枝军
邵鹏
严锴
徐秀丽
李雪红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Gongda Traffic Technology Co ltd
Suzhou Port And Shipping Development Center
Nanjing Tech University
Original Assignee
Nanjing Gongda Traffic Technology Co ltd
Suzhou Port And Shipping Development Center
Nanjing Tech University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Gongda Traffic Technology Co ltd, Suzhou Port And Shipping Development Center, Nanjing Tech University filed Critical Nanjing Gongda Traffic Technology Co ltd
Priority to CN202310507383.0A priority Critical patent/CN116563626A/zh
Publication of CN116563626A publication Critical patent/CN116563626A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • G06V10/765Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Testing Resistance To Weather, Investigating Materials By Mechanical Methods (AREA)

Abstract

本发明公开一种钢桥螺栓锈蚀率的预测方法,包括:对拍摄的图像进行预处理;将处理后的图像送入TWS算法中,通过不同的锈蚀程度的RGB值的差异,融合机器学习算法,实现对锈蚀颜色阈值分割,识别出轻微、中度、严重锈蚀区域;对识别后的图像的相应锈蚀区与其他区域二值化处理,计算整体锈蚀率;将自然锈蚀过程中的环境参数数据作为自变量,轻微锈蚀率、中度锈蚀率、严重锈蚀率、整体锈蚀率作为因变量输入到随机森林算法中,构建随机森林模型,输入影响因素的含量,预测各阶段的锈蚀率。本发明利用RGB阈值分割筛分螺栓相近的锈蚀颜色,提取锈蚀区域,并利用随机森林将钢桥螺栓锈蚀率与自然环境建立相关性,解决钢桁架桥节点螺栓难检测、难评价的困顿。

Description

钢桥螺栓锈蚀率的预测方法
技术领域
本发明涉及机器学习领域,特别是涉及一种基于Weka和随机森林实现钢桥螺栓锈蚀率的预测方法。
背景技术
螺栓作为钢桥中的重要组成部分,其安全性的保障一直都是桥梁健康监测的重点内容之一。高强螺栓作为钢桁架桥节点连接的关键零件,其锈蚀、脱落对节点的受力的改变一直以来都是研究的难点内容。
现有的方案是利用锈蚀电流或者质量法来实现对锈蚀程度的评判工作,且锈蚀的重点更多的关注于钢板部分,针对上亿的螺栓的锈蚀评价,并未出现针对性的方案,并不适用于采取锈蚀电流的方法,螺栓的锈蚀具有更复杂的桥梁自然环境和更大的随机性与非线性。
发明内容
有鉴于此,本发明的目的在于提供一种钢桥螺栓锈蚀率的预测方法,该方法适应复杂的自然环境,能够为钢桥螺栓锈蚀提供一种可预测的评价方法。
本发明提供一种钢桥螺栓锈蚀率的预测方法,包括:
步骤S1:利用相机采集钢桥螺栓锈蚀的数据集;
步骤S2:对所述数据集的每张照片进行去背景处理,以得到形成仅剩目标螺栓的各张图像;
步骤S3:在仅剩目标螺栓的各张图像中,获取同时具有螺栓的轻度锈蚀、中度锈蚀和重度锈蚀的单张图像,对获取到的每张图像的螺栓的轻度、中度和重度锈蚀区域分别添加对应锈蚀程度分类的标注信息;
步骤S4:将含有锈蚀程度分类的标注信息的图像送入图像分割算法中,以对含有锈蚀程度分类的标注信息的图像中不同锈蚀程度区域的识别,训练出适合图像锈蚀程度分类的机器学习训练模型,并将图像中的锈蚀区域按照不同锈蚀程度分别用不同的颜色区分开,以得到RGB三色图;
步骤S5:将所述RGB三色图转换成对应的灰度图;
步骤S6:将所述灰度图的A类区域、B类区域和C类区域分别转换为对应的二值化图像,以得到三张A类区域、B类区域和C类区域的二值化图像;
步骤S7:基于数据集中每张照片对应的三张A类区域、B类区域和C类区域的二值化图像,得到每张照片对应的整体锈蚀率,将整体锈蚀率作为因变量;将各个自然环境因素作为自变量;
步骤S8:将自变量作为输入,并将因变量作为样本集,输入到随机森林算法中,构建随机森林模型,通过训练随机森林模型,给出各个自然环境因素的权重值;
步骤S9:根据各个自然环境因素的权重值的大小,去掉权重值较小的自然环境因素,修正剩余的自然环境因素的权重值,以更正后的随机森林模型;
步骤S10:向更正后的随机森林模型输入实际的自然环境因素数据,从随机森林模型获取预测出的螺栓对应的锈蚀率。
进一步的,上述钢桥螺栓锈蚀率的预测方法中,步骤S2,包括:
利用OpenCV库中的GrabCut算法,将数据集的每张照片分为前景和后景,对后景进行移除,形成仅剩目标螺栓的各张图像。
进一步的,上述钢桥螺栓锈蚀率的预测方法中,步骤S3:对获取到的每张图像的螺栓的轻度、中度和重度锈蚀区域分别添加对应锈蚀程度分类的标注信息,包括:
将RGB值为(105,105,105)及其周边预设范围波动值的区域或(255,235,181)及其周边预设范围波动值的区域,设置对应的标注信息为C类区域;
将RGB值为(150,75,0)及其周边预设范围波动值的区域或(230,190,20)及其周边预设范围波动值的区域,设置对应的标注信息为B类区域;
将RGB值为(165,42,42)及其周边预设范围波动值的区域或(210,180,140)及其周边预设范围波动值的区域,设置对应的标注信息为A类区域。
进一步的,上述钢桥螺栓锈蚀率的预测方法中,步骤S4,包括:
步骤S41,将含有锈蚀程度分类的标注信息的图像送入TWS图像分割算法中,以对含有锈蚀程度分类的标注信息的图像中不同锈蚀程度区域的识别,训练出适合图像锈蚀程度分类的机器学习模型,并将图像中的锈蚀区域按照不同锈蚀程度分别用红、绿和蓝三种不同的颜色区分开,以得到RGB三色图,其中,红色代表A类区域、绿色代表B类区域、蓝色代表C类区域。
进一步的,上述钢桥螺栓锈蚀率的预测方法中,步骤S41,将含有锈蚀程度分类的标注信息的图像送入TWS图像分割算法中,包括:
取含有锈蚀程度分类的标注信息单张图像中的高斯噪声,使同一锈蚀锈蚀程度的像素值更加平滑,其二维高斯公式如下式(2):
式中:
Gσ——图像高斯模糊的权重值;
(x,y)——像素点的位置;
σ——方差;
高斯模糊时采用不同的σ参数,σ等于σmin,2σmin,4σmin,…,2n-1σmin,其中,2n-1σmin≤σmax,使用高斯核执行5个单独的卷积,形成5张具有不同σ值的图像F;
将5张具有不同σ值的图像F,利用Sobel算子进一步做边缘检测,Sobel算子通过计算每个像素点处图像强度梯度的近似值,其公式如下式(3):
Ph=Kh*P,Pv=Kv*P (4)
式中:
Kh、Kv——Sobel水平边缘检测矩阵与垂直边缘检测矩阵;
Ph、Pv——水平方向与垂直方向梯度幅值;
Pm——计算出的图像强度梯度的近似值;
通过上述操作,得到5张具有边缘特征的图像G;
同时,对图像F进行一个高斯差分处理,其中m在图像F中,用任意一个减去另一个,如式(6):
式中:
DoG——像素点的高斯差分后的像素值;
f(x,y)——原图像的像素点的像素值;
g(x,y)——高斯模糊后的像素值。
经过高斯差分处理后产生10张具有特征的图像H;
将5张图像F、5张图像G和10张图像,全部送入TWS图像分割算法中训练。
进一步的,上述钢桥螺栓锈蚀率的预测方法中,步骤S5,包括:
将8bit下的RGB三色图转化为8bit下的灰度图,RGB三色图中每个像素点的转换公式参照如式(1):
P=Gray=R*0.299+G*0.587+B*0.114 (1)
式中:
P——表示转化后的灰度值;
R、G、B——分别表示8bit下的红、绿、蓝、单通的像素值。
进一步的,上述钢桥螺栓锈蚀率的预测方法中,步骤S6,包括:
根据灰度图,利用imageJ中的threshold()函数模块设置交互式阈值上限与下限中的,以灰度阈值区间(0,30)作为C类区域的二值化条件、以灰度阈值区间(30,77)作为A类区域的二值化条件和以灰度阈值区间(77,151)作为B类区域的二值化条件,在各自区域的灰度阈值区间的部分设置为白色,灰度值为0,剩余部分设置为黑色,灰度值为255,得到三张A类区域、B类区域和C类区域的二值化图像。
进一步的,上述钢桥螺栓锈蚀率的预测方法中,步骤S7,包括:
拾取上述三张A类区域、B类区域和C类区域的二值化图像中的白色锈蚀区域的面积,计算锈蚀率IA、IB、IC,得到不同锈蚀程度的锈蚀率,锈蚀率IA、IB、IC之和即为整体锈蚀率I,利用所述机器学习训练模型,将整体锈蚀率作为因变量;
通过前期环境监测站记录,采集一年内钢桥螺栓周围的自然环境中的降雨量状态、温度、相对湿度、NO2、CO、SO2、O3、Cl离子和PM2.5的自然环境数据,将自然环境数据作为自变量;
采集三张A类区域、B类区域和C类区域的二值化图像对应的钢桥螺栓周围的自然环境中的降雨量状态、温度、相对湿度、NO2、CO、SO2、O3、Cl-离子和PM2.5的自然环境因素,将自然环境因素作为自变量。
进一步的,上述钢桥螺栓锈蚀率的预测方法中,步骤S8,训练随机森林模型,包括:
首先,随机森林算法模型的输入是以自然环境因素为自变量,整体锈蚀率为因变量的数组作为样本集,即D={(x1,y1),(x2,y2),...(xm,ym)},其中,D代表样本集,xm表示自然环境因素数据,是一个多维的数据,ym代表整体锈蚀率I,通过弱分类器迭代T次,输出为最终的强分类器f(x)。
其次,对于t=1,2...,T,取T=100次,对所述样本集按照训练集:验证集=8:2设置,对训练集进行第100次随机采样,共采集100次,得到包含样本的采样集D100
然后,用采样集D100训练100个决策树模型Gm(x),在训练决策树模型的节点的时候,在节点上所有的样本特征中选择一部分样本特征,在这些随机选择的一部分样本特征中选择一个最优的特征来做决策树的左右子树划分;由这100个分类和决策树子空间构成随机森林模型,在每个决策树子空间中平均训练数据的输出的锈蚀率Ipre
最后,输入验证集进行随机验证,预测出的锈蚀率Ipre,对训练样本和预测样本的准确性的评价方法采取R2计算,如式(7)所示,或按照RMSE评估,如式(8)所示;基于R2计算或RMSE评估,得到评估较好的随机森林模型:
其中:
N——数据集的总数;
和yn——分别表示第n个样本的预测出的锈蚀率Ipre和真实值;
——所有样本的真实值的平均值;
RMSE——均方根误差;
R——标准误差。
本发明的有益效果是:
传统的方法是利用锈蚀电流或锈蚀前后的质量差异来表征锈蚀程度,且桥梁领域集中于钢板或者钢筋,本发明突破了传统的锈蚀评价方法和领域,对钢桥的高强螺栓锈蚀评价方法中,首次采用锈蚀率来评价其锈蚀程度,创新性的提出了利用锈蚀程度RGB值的差异性,基于Java环境下,使用像素点进行颜色阈值分割的学习分类,拾取锈蚀率,并创新性的将锈蚀率首次作为因变量与自变量(自然环境中的降雨量状态、温度、相对湿度、NO2、CO、SO2、O3、PM2.5数据)送入随机森林算法中,构建RF模型,建立起锈蚀率与自然环境之间的非线性关系,通过随机森林模型,给定环境条件,预测出螺栓锈蚀的的速率,达到钢桥螺栓锈蚀率的评价目的,本发明具有更好的泛用性和鲁棒性。
附图说明
图1为本发明一实施例的整体流程示意图;
图2为本发明一实施例的Trainable Weka Segmentation的原理步骤图;
图3为本发明一实施例的RF模型图;
图4为本发明一实施例的CART决策树弱模型训练图。
具体实施方式
如何防止螺栓的锈蚀病害,使得钢桁架桥保持原有的力学性能是目前本领域的研究重点,了解自然环境下的钢桥螺栓锈蚀规律及其评价方法有助于桥梁工程师对更加准确地对桥梁节点力学性能的评估,在结构健康监测中,有助于更加准确的掌握桥梁的健康状况及其全寿命周期的节点特性。开发研究螺栓锈蚀的评价方法,填补国内螺栓锈蚀病害评价指标方向的空白,推动计算机视觉、智能化方法在桥梁结构健康监测方向的发展,实现学科之间的行业交叉,助推产业升级,监测模式的智能化升级,从病后诊治到病前预估,实现提早预测、提前发现、提前更换的最终目标。
有鉴于此,本发明的目的在于提供一种钢桥螺栓锈蚀率的预测方法,该方法适应复杂的自然环境,能够为钢桥螺栓锈蚀提供一种可预测的评价方法。
随机森林(RF),是机器学习领域中的一种有监督式学习方式。
RGB是图片的颜色通道,任何图片都可以看做由红、绿、蓝三种颜色的叠加。
Trainable Weka Segmentation,是一种基于Java环境下的,通过基于像素点进行机器学习的方法。
本发明包括:对拍摄的图像进行预处理,主要有背景分割、均值滤波、图像均衡化,消除噪点及光照对图像的影响,提取需要的螺栓部分;将处理后的图像送入TrainableWeka Segmentation中,通过不同的锈蚀程度的RGB值的差异,融合机器学习算法,实现对锈蚀的颜色阈值分割,识别出轻微锈蚀、中度锈蚀、严重锈蚀区域;对识别后的图像采取8bit转换,使相应锈蚀区与其他区域二值化处理,将分别计算出相应区域的面积比,之和即为整体锈蚀率;将自然锈蚀过程中的环境参数,即降雨量状态、温度、相对湿度、NO2、CO、SO2、O3、Cl-离子、PM2.5等数据作为自变量,轻微锈蚀率、中度锈蚀率、严重锈蚀率、整体锈蚀率分别作为因变量输入到随机森林算法中,构建随机森林模型,拟合各种因素与锈蚀率之间的曲线关系,得出锈蚀的评价模型并部署,输入影响因素的含量,即可预测各阶段的锈蚀率。本发明首次利用RGB阈值分割筛分螺栓相近的锈蚀颜色,提取锈蚀区域,并首次利用随机森林将钢桥螺栓锈蚀率与自然环境建立相关性,填补国内在螺栓锈蚀评价方法与指标领域的空白,解决国内钢桁架桥节点螺栓难检测、难评价的困顿,给予桥梁工程人员适时判断螺使用状态的新的思路,并进一步为评价桥梁结构健康状况提供参考。
如图1所示,本发明的一种钢桥螺栓锈蚀率的预测方法,包括以下步骤:
步骤S1:数据采集。利用相机采集钢桥螺栓锈蚀的数据集;
优选的,可以采用时间跨度可以为1年,以7天为采集间断点,对螺栓锈蚀照片进行拍摄采集,形成具有时间序列的周期数据作为所述钢桥螺栓锈蚀的数据集,本方案中所用照片可以均为4608×3456彩色图像,对图片数据集进行整理编号,形成使用数据集。
步骤S2:对所述数据集的每张照片进行去背景处理,以消除背景对机器学习过程的影响;
具体为,利用OpenCV库中的GrabCut算法,将数据集的每张照片分为前景和后景,对后景进行移除,形成仅剩目标螺栓的各张图像。
步骤S3:在仅剩目标螺栓的各张图像中,获取单张图像中同时具有螺栓的轻度锈蚀、中度锈蚀和重度锈蚀的图像,对获取到的每张图像的螺栓的轻度、中度和重度锈蚀区域分别添加对应锈蚀程度分类的标注信息;
在此,该标注信息是基于彩色图像像素点的标注,标注时,对锈蚀程度分类的划分来源如下:
根据DS/EN ISO 8501-1-2007中对锈蚀的等级划分,并查询相关RGB值,得出:
钢桥高强螺栓的轻度锈蚀表现为暗灰色或者淡黄色,其RGB值(105,105,105)与(255,235,181);
中度锈蚀表现为褐色或者棕黄色,其RGB值(150,75,0)与(230,190,20);
重度锈蚀表现为棕色或者棕褐色,其RGB值为(165,42,42)与(210,180,140);
考虑到同种锈蚀颜色的正常波动范围,标注锈蚀区域时,在暗灰色、褐色或者棕黄色、棕色或者棕褐色各自周边预设范围波动的值均视为各自所属的锈蚀分类;
标注时,标注类别具体分为A、B、C三种,其中:
C:轻度锈蚀。表现为暗灰色或者淡黄色,属于锈蚀刚发生初期,仅有少量颜色较浅的锈蚀。
B:中度锈蚀。表现为棕黄色或者褐色,并且伴有少量的点蚀情况,属于锈蚀发展的中期,表面大部分被锈蚀覆盖。
A:重度锈蚀。表现为棕色或者棕褐色,且伴有大量的点蚀情况,表面基本上锈蚀,向深色转化,氧化层全面剥离。
标注完成后,得到在单张图像上含有不同类别的锈蚀区域的标注信息。
步骤S4:将含有锈蚀程度分类的标注信息的图像送入图像分割算法如TWS算法(Trainable Weka Segmentation)中,以对含有锈蚀程度分类的标注信息的图像中不同锈蚀程度区域的识别,训练出适合图像锈蚀程度分类的机器学习训练模型,并将图像中的锈蚀区域按照不同锈蚀程度分别用红、绿和蓝三种不同的颜色区分开,以得到RGB三色图,其中,红色代表A类区域、绿色代表B类区域、蓝色代表C类区域;
在此,Trainable Weka Segmentation是在基于Java环境下,利用机器学习实现基于颜色阈值的图像分割,通过对像素点的学习,实现对不同锈蚀程度区域的识别,训练出适合图像锈蚀程度分类的机器学习模型,并将该图片的锈蚀区域按照不同的锈蚀程度用不同的颜色区分开,以红色代表A类区域、绿色代表B类区域、蓝色代表C类区域,保存该训练结果。
步骤S5:将所述RGB三色图转换成对应的灰度图;
具体的上述训练结果呈现的是8bit下的RGB三色图,为了便于对单一锈蚀程度进行二值化处理,需将其转化为8bit下的灰度图,RGB三色图中每个像素点的转换公式参照如式(1):
P=Gray = R*0.299 + G*0.587 + B*0.114 (1)
式中:
P——表示转化后的灰度值;
R、G、B——分别表示8bit下的红、绿、蓝、单通的像素值;
按照公式计算,转换后的A区域的每个像素点的灰度值为76,B区域的每个像素点的灰度值为150,C区域的每个像素点的灰度值为29,形成一张具有目标区域的灰度图片。
步骤S6:将所述灰度图的A类区域、B类区域和C类区域分别转换为对应的二值化图像;
具体的,根据灰度图,利用imageJ中的threshold()函数模块设置交互式阈值上限与下限中的,以灰度阈值区间(0,30)作为C类区域的二值化条件、以灰度阈值区间(30,77)作为A类区域的二值化条件和以灰度阈值区间(77,151)作为B类区域的二值化条件,在各自区域的灰度阈值区间的部分设置为白色,灰度值为0,剩余部分设置为黑色,灰度值为255,得到三张A类区域、B类区域和C类区域的二值化图像。
步骤S7:分别拾取上述三张A类区域、B类区域和C类区域的二值化图像中的白色锈蚀区域的面积,计算锈蚀率IA、IB、IC,得到不同锈蚀程度的锈蚀率,锈蚀率IA、IB、IC之和即为整体锈蚀率I,利用S4中的机器学习训练模型,处理数据集的所有图片,重复S5、S6步骤得到数据集每张图片的整体锈蚀率,将整体锈蚀率作为因变量;并且通过前期环境监测站记录,采集三张A类区域、B类区域和C类区域的二值化图像对应的钢桥螺栓周围的自然环境中的降雨量状态、温度、相对湿度、NO2、CO、SO2、O3、Cl-离子和PM2.5的自然环境数据,将自然环境数据作为自变量。形成以环境数据为自变量的输入,以锈蚀率为因变量的输出数据。
步骤S8:将自变量作为输入,并将因变量作为样本集,输入到随机森林算法中,构建随机森林模型,通过训练随机森林模型,给出各个自然环境因素的权重,即重要性系数。
在此,随机森林算法是一种机器学习算法,对非线性数据集具有很好的拟合能力,可以通过训练,找出自然环境因素与锈蚀之间的非线性关系。通过训练随机森林模型,给出所有自然环境因素的权重值,即重要性系数。
步骤S9:根据重要性系数可知,温度、湿度、降雨量状态与离子浓度是影响最大的,去掉影响系数最小的PM2.5、O3的值,修正其他权重值,得到全年螺栓受各种自然因素影响的规律,形成更正后的随机森林模型。
步骤S10:向更正厚度随机森林模型输入实际的自然环境因素数据,从随机森林模型获取预测出的螺栓对应的锈蚀率。
进一步地,在步骤S4中,Trainable Weka Segmentation是基于Java环境下,将一系列机器学习算法与一组选定的图像特征相结合,以产生基于像素分割的方法,具体见附图2所示,在送入算法训练之前,需要对标注的图像进行一定的处理,以产生具有明显特征的图像,每一次处理均会产生一个图像,最终形成不同处理的图像堆栈,图像处理的主要方法有高斯模糊处理、Sobel滤波器、高斯差异处理特征。
首先取含有锈蚀程度分类的标注信息单张图像中的高斯噪声,使同一锈蚀锈蚀程度的像素值更加平滑,其二维高斯公式如下式(2):
式中:
Gσ——图像高斯模糊的权重值;
(x,y)——像素点的位置;
σ——方差;
高斯模糊时采用不同的σ参数。σ通常等于σmin,2σmin,4σmin,…,2n-1σmin,其中2n-1σmin≤σmax。默认情况下σmin=1,σmax=16,因此n=5。半径越大,图像变得越模糊,直到像素都是均匀的。使用高斯核执行5个单独的卷积,形成5张具有不同σ值的图像F。
其次,将前述处理的图利用Sobel算子进一步做边缘检测,其目的是使得各种锈蚀程度之间的边缘更加界限分明,Sobel算子通过计算每个像素点处图像强度梯度的近似值,其公式如下式(3):
Ph=Kh*P,Pv=Kv*P (4)
式中:
Kh、Kv——Sobel水平边缘检测矩阵与垂直边缘检测矩阵;
Ph、Pv——水平方向与垂直方向梯度幅值;
Pm——计算出的图像强度梯度的近似值。
通过上述操作,得到5张具有边缘特征的图像G;
同时,对高斯模糊后的图像F进行一个高斯差分处理,其目的是检测图像多尺度下的细节结构,使得锈蚀特征更加准确突出,其原理是在高斯模糊后的图像中,用任意一个减去另一个,具体如式(6):
式中:
DoG——像素点的高斯差分后的像素值;
f(x,y)——原图像的像素点的像素值;
g(x,y)——高斯模糊后的像素值。
因σ值通常是变化的,因此经过高斯差分后产生n(n-1)/2个图像,即产生10个具有特征的图像H,将前述处理的具有图像特征的20张图片/(图像F共5张、图像G共5张、图像H共10张)全部送入图像分割算法中训练。
进一步地,在步骤S8中,进行随机森林算法模型训练的步骤是:
首先,随机森林算法模型的输入是以自然环境因素为自变量,螺栓的整体锈蚀率为因变量的数组作为样本集,即D={(x1,y1),(x2,y2),...(xm,ym)},其中D代表样本集,xm表示自然环境影响因素数据,是一个多维的数据,ym代表整体锈蚀率I,通过弱分类器迭代T次,输出为最终的强分类器f(x)。
其次,对于t=1,2...,T,具体次数由训练效果确定,在本项目中,取T=100次,对上述输入的样本集按照训练集:验证集=8:2设置,对训练集进行第100次随机采样,共采集100次,得到包含样本的采样集D100
然后,用采样集D100训练100个决策树模型Gm(x),在训练决策树模型的节点的时候,在节点上所有的样本特征中选择一部分样本特征,在这些随机选择的部分样本特征中选择一个最优的特征来做决策树的左右子树划分。RF模型由这100个分类和决策树(CART)子空间构成,在每个子空间中平均训练数据的输出的锈蚀率Ipre,对输出的锈蚀率求取平均值来避免单个决策树模型过拟合或者不稳定的影响,形成由多个弱模型组成的一个强训练模型。
最后,输入验证集数据的x进行随机验证,预测出的锈蚀率Ipre,我们对训练样本和预测样本的准确性的评价方法采取R2计算,如式(7)所示,也可按照RMSE评估,如式(8)所示,评估较好的模型,即可得出不同输入对整体锈蚀率I的影响:
其中:
N——数据集的总数;
和yn——分别表示第n个样本的预测出的锈蚀率Ipre和真实值;
——所有样本的真实值的平均值;
RMSE——均方根误差;
R——标准误差。
通过验证,R2接近为1,RMSE较小,预测的Ipre与实际的yn基本吻合,说明随机森林模型的拟合能力较好,可作为评价钢桥螺栓锈蚀率的预测模型,部署该随机森林模型,作为钢桥螺栓锈蚀率的评价方法,随机森林具体原理见图3、图4所示。
本发明的有益效果是:
传统的方法是利用锈蚀电流或锈蚀前后的质量差异来表征锈蚀程度,且桥梁领域集中于钢板或者钢筋,本发明突破了传统的锈蚀评价方法和领域,对钢桥的高强螺栓锈蚀评价方法中,首次采用锈蚀率来评价其锈蚀程度,创新性的提出了利用锈蚀程度RGB值的差异性,基于Java环境下,使用像素点进行颜色阈值分割的学习分类,拾取锈蚀率,并创新性的将锈蚀率首次作为因变量与自变量(自然环境中的降雨量状态、温度、相对湿度、NO2、CO、SO2、O3、PM2.5数据)送入随机森林算法中,构建RF模型,建立起锈蚀率与自然环境之间的非线性关系,通过随机森林模型,给定环境条件,预测出螺栓锈蚀的的速率,达到钢桥螺栓锈蚀率的评价目的,本发明具有更好的泛用性和鲁棒性。
本发明未详述之处,均为本领域技术人员的公知技术。
以上详细描述了本发明的具体实施过程。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (9)

1.一种钢桥螺栓锈蚀率的预测方法,其特征在于,包括:
步骤S1:利用相机采集钢桥螺栓锈蚀的数据集;
步骤S2:对所述数据集的每张照片进行去背景处理,以得到形成仅剩目标螺栓的各张图像;
步骤S3:在仅剩目标螺栓的各张图像中,获取同时具有螺栓的轻度锈蚀、中度锈蚀和重度锈蚀的单张图像,对获取到的每张图像的螺栓的轻度、中度和重度锈蚀区域分别添加对应锈蚀程度分类的标注信息;
步骤S4:将含有锈蚀程度分类的标注信息的图像送入图像分割算法中,以对含有锈蚀程度分类的标注信息的图像中不同锈蚀程度区域的识别,训练出适合图像锈蚀程度分类的机器学习训练模型,并将图像中的锈蚀区域按照不同锈蚀程度分别用不同的颜色区分开,以得到RGB三色图;
步骤S5:将所述RGB三色图转换成对应的灰度图;
步骤S6:将所述灰度图的A类区域、B类区域和C类区域分别转换为对应的二值化图像,以分别得到A类区域、B类区域和C类区域的共三张二值化图像;
步骤S7:基于数据集中每张照片对应的A类区域、B类区域和C类区域的二值化图像,得到每张照片对应的整体锈蚀率,将整体锈蚀率作为因变量;将各个自然环境因素作为自变量;
步骤S8:将自变量和因变量作为样本集,输入到随机森林算法中,构建随机森林模型,通过训练随机森林模型,给出各个自然环境因素的权重值;
步骤S9:根据各个自然环境因素的权重值的大小,去掉权重值较小的自然环境因素,修正剩余的自然环境因素的权重值,以更正后的随机森林模型;
步骤S10:向更正后的随机森林模型输入实际的自然环境因素数据,从随机森林模型获取预测出的螺栓对应的锈蚀率。
2.如权利要求1所述的钢桥螺栓锈蚀率的预测方法,其特征在于,步骤S2,包括:
利用OpenCV库中的GrabCut算法,将数据集的每张照片分为前景和后景,对后景进行移除,形成仅剩目标螺栓的各张图像。
3.如权利要求1所述的钢桥螺栓锈蚀率的预测方法,其特征在于,步骤S3:对获取到的每张图像的螺栓的轻度、中度和重度锈蚀区域分别添加对应锈蚀程度分类的标注信息,包括:
将RGB值为(105,105,105)及其周边预设范围波动值的区域,或RGB值为(255,235,181)及其周边预设范围波动值的区域,设置对应的标注信息为C类区域;
将RGB值为(150,75,0)及其周边预设范围波动值的区域,或RGB值为(230,190,20)及其周边预设范围波动值的区域,设置对应的标注信息为B类区域;
将RGB值为(165,42,42)及其周边预设范围波动值的区域,或RGB值为(210,180,140)及其周边预设范围波动值的区域,设置对应的标注信息为A类区域。
4.如权利要求3所述的钢桥螺栓锈蚀率的预测方法,其特征在于,步骤S4,包括:
步骤S41,将含有锈蚀程度分类的标注信息的图像送入TWS图像分割算法中,以对含有锈蚀程度分类的标注信息的图像中不同锈蚀程度区域的识别,训练出适合图像锈蚀程度分类的机器学习模型,并将图像中的锈蚀区域按照不同锈蚀程度分别用红、绿和蓝三种不同的颜色区分开,以得到RGB三色图,其中,红色代表A类区域、绿色代表B类区域、蓝色代表C类区域。
5.如权利要求4所述的钢桥螺栓锈蚀率的预测方法,其特征在于,步骤S41,将含有锈蚀程度分类的标注信息的图像送入TWS图像分割算法中,包括:
取含有锈蚀程度分类的标注信息单张图像中的高斯噪声,使同一锈蚀锈蚀程度的像素值更加平滑,其二维高斯公式如下式(2):
式中:
Gσ表示图像高斯模糊的权重值;
(x,y)表示像素点的位置;
σ表示方差;
高斯模糊时采用不同的σ参数,σ等于σmin,2σmin,4σmin,…,2n-1σmin,其中,2n-1σmin≤σmax,使用高斯核执行5个单独的卷积,形成5张具有不同σ值的图像F;
将5张具有不同σ值的图像F,利用Sobel算子进一步做边缘检测,Sobel算子通过计算每个像素点处图像强度梯度的近似值,其公式如下式(3):
Ph=Kh*P,Pv=Kv*P (4)
式中:
Kh、Kv表示Sobel水平边缘检测矩阵与垂直边缘检测矩阵;
Ph、Pv表示水平方向与垂直方向梯度幅值;
Pm表示计算出的图像强度梯度的近似值;
通过上述操作,得到5张具有边缘特征的图像G;
同时,对图像F进行一个高斯差分处理,其中m在图像F中,用任意一个减去另一个,如式(6):
式中:
DoG表示像素点的高斯差分后的像素值;
f(x,y)表示原图像的像素点的像素值;
g(x,y)表示高斯模糊后的像素值;
经过高斯差分处理后产生10张具有特征的图像H;
将5张图像F、5张图像G和10张图像,全部送入TWS图像分割算法中训练。
6.如权利要求5所述的钢桥螺栓锈蚀率的预测方法,其特征在于,步骤S5,包括:
将8bit下的RGB三色图转化为8bit下的灰度图,RGB三色图中每个像素点的转换公式参照如式(1):
P=Gray=R*0.299+G*0.587+B*0.114 (1)
式中:
P表示转化后的灰度值;
R、G、B分别表示8bit下的红、绿、蓝、单通的像素值。
7.如权利要求6所述的钢桥螺栓锈蚀率的预测方法,其特征在于,步骤S6,包括:
根据灰度图,利用imageJ中的threshold()函数模块设置交互式阈值上限与下限中的,以灰度阈值区间(0,30)作为C类区域的二值化条件、以灰度阈值区间(30,77)作为A类区域的二值化条件和以灰度阈值区间(77,151)作为B类区域的二值化条件,在各自区域的灰度阈值区间的部分设置为白色,灰度值为0,剩余部分设置为黑色,灰度值为255,得到三张A类区域、B类区域和C类区域的二值化图像。
8.如权利要求7所述的钢桥螺栓锈蚀率的预测方法,其特征在于,步骤S7,包括:
拾取所述A类区域、B类区域和C类区域的二值化图像中的白色锈蚀区域的面积,计算锈蚀率IA、IB、IC,得到不同锈蚀程度的锈蚀率,锈蚀率IA、IB、IC之和即为整体锈蚀率I,利用所述机器学习训练模型,将整体锈蚀率作为因变量;
通过前期环境监测站记录,采集一年内钢桥螺栓周围的自然环境中的降雨量状态、温度、相对湿度、NO2、CO、SO2、O3、Cl离子和PM2.5的自然环境数据,将自然环境数据作为自变量;
采集A类区域、B类区域和C类区域的二值化图像对应的钢桥螺栓周围的自然环境中的降雨量状态、温度、相对湿度、NO2、CO、SO2、O3、Cl-离子和PM2.5的自然环境因素,将自然环境因素作为自变量。
9.如权利要求7所述的钢桥螺栓锈蚀率的预测方法,其特征在于,步骤S8,训练随机森林模型,包括:
首先,随机森林算法模型的输入是以自然环境因素为自变量,整体锈蚀率为因变量的数组作为样本集,即D={(x1,y1),(x2,y2),...(xm,ym)},其中,D代表样本集,xm表示自然环境因素数据,是一个多维的数据,ym代表整体锈蚀率I,通过弱分类器迭代T次,输出为最终的强分类器f(x);
其次,对于t=1,2...,T,取T=100次,对所述样本集按照训练集:验证集=8:2设置,对训练集进行第100次随机采样,共采集100次,得到包含样本的采样集D100
然后,用采样集D100训练100个决策树模型Gm(x),在训练决策树模型的节点的时候,在节点上所有的样本特征中选择一部分样本特征,在这些随机选择的一部分样本特征中选择一个最优的特征来做决策树的左右子树划分;由这100个分类和决策树子空间构成随机森林模型,在每个决策树子空间中平均训练数据的输出的锈蚀率Ipre
最后,输入验证集进行随机验证,预测出的锈蚀率Ipre,对训练样本和预测样本的准确性的评价方法采取R2计算,如式(7)所示,或按照RMSE评估,如式(8)所示;基于R2计算或RMSE评估,得到评估较好的随机森林模型:
其中:
N表示数据集的总数;
和yn分别表示第n个样本的预测出的锈蚀率Ipre和真实值;/>表示所有样本的真实值的平均值;
RMSE表示均方根误差;
R表示标准误差。
CN202310507383.0A 2023-05-06 2023-05-06 钢桥螺栓锈蚀率的预测方法 Pending CN116563626A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310507383.0A CN116563626A (zh) 2023-05-06 2023-05-06 钢桥螺栓锈蚀率的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310507383.0A CN116563626A (zh) 2023-05-06 2023-05-06 钢桥螺栓锈蚀率的预测方法

Publications (1)

Publication Number Publication Date
CN116563626A true CN116563626A (zh) 2023-08-08

Family

ID=87497631

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310507383.0A Pending CN116563626A (zh) 2023-05-06 2023-05-06 钢桥螺栓锈蚀率的预测方法

Country Status (1)

Country Link
CN (1) CN116563626A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334750A (zh) * 2019-06-21 2019-10-15 西安工程大学 输电线路铁塔螺栓锈蚀程度图像分类识别方法
CN112348264A (zh) * 2020-11-10 2021-02-09 南京钢铁股份有限公司 一种基于随机森林算法的碳钢腐蚀速率预测方法
CN112699824A (zh) * 2021-01-05 2021-04-23 湖北理工学院 电能表仪表常数检测方法、设备及存储介质
CN114842367A (zh) * 2022-04-20 2022-08-02 杭州电子科技大学 一种复杂环境下的红外绝缘子与钢帽的识别与分割方法
CN115841471A (zh) * 2022-12-06 2023-03-24 西安近代化学研究所 一种基于像素聚类Transformer模型算法的金属腐蚀度计算方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334750A (zh) * 2019-06-21 2019-10-15 西安工程大学 输电线路铁塔螺栓锈蚀程度图像分类识别方法
CN112348264A (zh) * 2020-11-10 2021-02-09 南京钢铁股份有限公司 一种基于随机森林算法的碳钢腐蚀速率预测方法
CN112699824A (zh) * 2021-01-05 2021-04-23 湖北理工学院 电能表仪表常数检测方法、设备及存储介质
CN114842367A (zh) * 2022-04-20 2022-08-02 杭州电子科技大学 一种复杂环境下的红外绝缘子与钢帽的识别与分割方法
CN115841471A (zh) * 2022-12-06 2023-03-24 西安近代化学研究所 一种基于像素聚类Transformer模型算法的金属腐蚀度计算方法

Similar Documents

Publication Publication Date Title
Momeny et al. Accurate classification of cherry fruit using deep CNN based on hybrid pooling approach
Pan et al. Dual attention deep learning network for automatic steel surface defect segmentation
Omrani et al. Potential of radial basis function-based support vector regression for apple disease detection
Arya et al. Detection of unhealthy plant leaves using image processing and genetic algorithm with Arduino
CN110232380A (zh) 基于Mask R-CNN神经网络的火灾夜间场景复原方法
Rupanagudi et al. A cost effective tomato maturity grading system using image processing for farmers
CN111968081B (zh) 鱼群自动计数方法、装置、电子设备及存储介质
CN117253024B (zh) 一种基于机器视觉的工业盐质检管控方法及系统
CN112258525A (zh) 一种基于鸟类高帧频序列图像丰度统计和种群识别算法
CN114463280A (zh) 一种基于改进卷积变分自编码器的芯片表面缺陷并行检测方法
CN113313678A (zh) 一种基于多尺度特征融合的精子形态学自动分析方法
CN114065798A (zh) 基于机器识别的视觉识别方法及装置
CN110349119B (zh) 基于边缘检测神经网络的路面病害检测方法和装置
Paramanandham et al. Vision Based Crack Detection in Concrete Structures Using Cutting-Edge Deep Learning Techniques.
CN116563626A (zh) 钢桥螺栓锈蚀率的预测方法
Zahan et al. A deep learning-based approach for mushroom diseases classification
CN113160166B (zh) 通过卷积神经网络模型进行医学影像数据挖掘工作方法
CN104463173A (zh) 一种基于概率密度比值的作物病害识别方法
Sonsare et al. Leaf Infection Detection Using Fuzzy Support Vector Machine.
Mirra et al. Classification of Fruits using Deep Learning Algorithms
CN118015476B (zh) 基于低参数神经网络与标准化流的铁路外部环境遥感变化检测方法及系统
Halim et al. The use of mathematical morphology and template matching in automatic malaysian car plate number recognition
Hidayah et al. Detection of rubber (Heavea brasialiensis) leaf diseases using image processing techniques
Balmik et al. A vision-based litter detection and classification using SSD MobileNetv2
Dhir Novel adaptive neuro-fuzzy based edge detection technique

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination