CN116843895A - 一种基于图像识别的车辆胎压与重量联合预测方法及系统 - Google Patents
一种基于图像识别的车辆胎压与重量联合预测方法及系统 Download PDFInfo
- Publication number
- CN116843895A CN116843895A CN202310624848.0A CN202310624848A CN116843895A CN 116843895 A CN116843895 A CN 116843895A CN 202310624848 A CN202310624848 A CN 202310624848A CN 116843895 A CN116843895 A CN 116843895A
- Authority
- CN
- China
- Prior art keywords
- image
- tire
- deep learning
- network model
- tire pressure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000013135 deep learning Methods 0.000 claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 27
- 230000006870 function Effects 0.000 claims abstract description 26
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 15
- 230000011218 segmentation Effects 0.000 claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 14
- 238000003708 edge detection Methods 0.000 claims abstract description 12
- 230000008569 process Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 210000002569 neuron Anatomy 0.000 claims description 3
- 230000007812 deficiency Effects 0.000 claims 1
- 238000012804 iterative process Methods 0.000 abstract description 2
- 238000005303 weighing Methods 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000013526 transfer learning Methods 0.000 description 7
- 230000006872 improvement Effects 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000011900 installation process Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 239000003973 paint Substances 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000005299 abrasion Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013021 overheating Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/096—Transfer learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/766—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using regression, e.g. by projecting features on hyperplanes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及机器视觉技术领域,公开一种基于图像识别的车辆胎压与重量联合预测方法及系统,以提高预测的便捷性和可靠性。方法包括:步骤S1、采集轮胎图像;步骤S2、通过语义分割网络将所采集的轮胎图像分割成轮胎、轮辋和背景三个区域,然后通过亚像素级边缘检测算法处理轮胎与背景交界处的轮廓图像,得到预处理图像;步骤S3、将预处理图像输入训练好的深度学习网络模型中,得到荷载和胎压所分别对应的预测值;其中,深度学习网络模型以经过上述步骤S1和步骤S2预处理后的图像进行训练,且在训练的迭代过程中,深度学习网络模型总的损失函数根据荷载回归损失函数和胎压回归损失函数所分别对应的权重进行融合计算。
Description
技术领域
本发明涉及机器视觉技术领域,尤其涉及一种基于图像识别的车辆胎压与重量联合预测方法及系统。
背景技术
近年来车辆超载现象频发,导致桥梁和道路的破坏严重。轮胎作为汽车与路面接触的唯一部件,其在荷载作用下的变形可以直观地反映车辆荷载,而荷载对轮胎的寿命、性能和安全性都有重要影响。荷载过重会加速轮胎磨损,缩短轮胎寿命;还会增加轮胎的制动距离,影响轮胎性能;甚至可能导致轮胎过热、爆胎、漏气和车辆失控等安全问题。在汽车行驶过程中,胎压会不同程度地影响车辆的安全驾驶。若胎压过高,容易降低轮胎的摩擦力和附着力,影响制动效果,也会使方向盘振动,从而导致车辆跑偏。若胎压过低,轮胎与路面的摩擦系数将增大,这会使轮胎和路面的摩擦成倍增加,胎面温度迅速升高,轮胎强度急剧下降,甚至会导致爆胎。因此准确获取行驶汽车的轮胎荷载与胎压信息是非常重要的。
一方面,现有的车辆称重方式有静态地磅称重、路面式动态称重系统和桥梁动态称重系统等。详述如下:
静态地磅式称重系统:该系统虽然测量精度较高,但是测量时要求车辆停车,容易引发车辆堵塞,且该系统安装过程繁琐,使用寿命不长以及耐久性较差。
路面式动态称重系统:该系统不需要停车,但其安装过程较为繁琐,且测量的精度受路面环境影响较大,传感器直接承受车辆荷载,造成其耐久性较差、维护费用较高等问题。
桥梁动态称重系统:相对于地磅称重以及路面式动态称重设备,它具有损伤更少、耐久性更好和识别精度高等优点,但该系统需安装在桥梁上,受环境影响大,且该系统可应用的桥型有限。
另一方面,目前轮胎气压获取主要是通过传感器获取轮胎气压信息,包括直接式TPMS系统、间接式TPMS系统和其他技术系统。详述如下:
直接式TPMS系统:直接式TPMS系统是利用安装在轮胎上的压力传感器来测量轮胎的气压和温度,利用无线发射器将压力信息从轮胎内部发送到中央接收器模块上的系统,然后对轮胎气压数据进行显示。当轮胎出现高压、低压或高温时,系统就会报警提示车主。并且车主可以根据车型,用车习惯,地理位置自行设定胎压报警值范围和温度报警值。
间接式TPMS系统:间接式TPMS系统需要通过汽车的ABS防抱死系统的轮速传感器来比较轮胎之间的转速差别,以达到监测胎压的目的。ABS通过轮速传感器来确定车轮是否抱死,从而决定是否启动防抱死系统。当轮胎压力降低时,车辆的重量会使轮胎直径变小,车速就会产生变化。车速变化就会触发报警系统,从而提醒车主注意轮胎胎压不足。
其他技术系统:利用麦克风获取轮胎与路面间的摩擦声音信号,对声音进行频谱分析获取声音信号的频率,建立频率-气压函数从而获取频率对应的轮胎气压。这种利用声音获取轮胎气压的方式,在声音收集阶段很容易受到噪音的干扰,对轮胎气压的识别准确性不高。
前文的直接式TPMS系统和间接式TPMS系统均是需要通过传感器获取信息,但是在现实中很多车辆没有安装胎压传感器。此外,利用声音获取轮胎气压信息严重依赖声音的获取品质,不利于实际应用。
但现有技术却鲜少将荷载与胎压进行联合预测。CN114202572A虽然公开一种基于机器视觉的车辆荷载测量、运输线路规划方法及系统,其涉及胎压和荷载,但其胎压是直接通过字符识别的,其作用在于结合轮胎的形变求解整车的荷载,而无需对胎压进行预测。因此,如何对荷载与胎压进行联合预测并提高其预测可靠性并规避现有单系统的诸多缺点成为技术盲点,有待于攻克。
发明内容
本发明目的在于公开一种基于图像识别的车辆胎压与重量联合预测方法及系统,以提高预测的便捷性和可靠性。
为达上述目的,本发明公开一种基于图像识别的车辆胎压与重量联合预测方法,包括:
步骤S1、采集轮胎图像;
步骤S2、通过语义分割网络将所采集的轮胎图像分割成轮胎、轮辋和背景三个区域,然后通过亚像素级边缘检测算法处理轮胎与背景交界处的轮廓图像,得到预处理图像;
步骤S3、将所述预处理图像输入训练好的深度学习网络模型中,得到荷载和胎压所分别对应的预测值;
其中,所述深度学习网络模型以经过上述步骤S1和步骤S2预处理后的图像进行训练,所对应的数据集中录入各图像所分别对应的荷载真实的标签值和胎压真实的标签值,且在训练的迭代过程中,将荷载标签和胎压标签对应的任务均设为回归任务,所述深度学习网络模型总的损失函数根据荷载回归损失函数和胎压回归损失函数所分别对应的权重进行融合计算。
为达上述目的,本发明还公开一种基于图像识别的车辆胎压与重量联合预测系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
本发明具有以下有益效果:
1、不依靠任何接触式设备,仅通过图像采集及相应处理就能实现轮胎荷载和胎压的非接触式双预测。
2、亚像素是比像素还小的单位,它将像素这个基本单位再进行细分,从而提高了图像分辨率。本发明将亚像素边缘检测算法用于轮胎与背景交界处的轮廓图像的处理,提高了训练模型的精度和预测结果的可靠性。
3、语义分割是计算机视觉中的基本任务,在语义分割中我们需要将视觉输入分为不同的语义可解释类别,“语义的可解释性”即分类类别在真实世界中是有意义的。例如,我们可能需要区分图像中属于汽车的所有像素,并把这些像素涂成蓝色。与图像分类或目标检测相比,语义分割使我们对图像有更加细致的了解。因此,本发明将语义分割与深度学习网络模型结合,实现了对轮胎荷载和胎压预测精度的提升。
4、深度学习网络模型在训练和测试中,其总的损失函数根据荷载回归损失函数和胎压回归损失函数所分别对应的权重进行融合计算,符合荷载和胎压之间存在直接关联关系的事实逻辑,提高了本发明模型双输出结果的预测可靠性。
下面将参照附图,对本发明作进一步详细的说明。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例公开的基于图像识别的车辆胎压与重量联合预测方法流程示意图。
图2是本发明优选实施例的经语义分割处理前后的对比图像示意图,其中,图2(a)为处理前的对比图像,图2(b)为处理后的效果图。
图3是本发明优选实施例的基于Zernike矩改进算法的斜坡-灰度边缘模型与传统两灰度边缘模型的对比示意图,其中,图3(a)对应传统的两灰度边缘模型,图3(b)为本实施例采用的斜坡-灰度边缘模型。
图4是本发明优选实施例的经亚像素级边缘检测处理前后的轮胎轮廓局部放大后对比示意图;其中,图4(a)为处理前的对比图像,图4(b)为处理后的效果图。
图5是本发明优选实施例的改进后的VGG16网络结构图。
具体实施方式
以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
实施例1
本实施例公开一种基于图像识别的车辆胎压与重量联合预测方法,如图1所示,包括:
步骤S1、采集轮胎图像。
该步骤可通过在道路或桥梁两侧架设数码相机,利用相机拍摄汽车轮胎图像。优选地,在采集过程中,可根据光照条件、拍摄角度、天气情况、距离和背景等多种因素进行合理的设备部署及图像数据的辅助处理。
其中,在构建模型训练数据集的过程中,在每次采集轮胎图像后,利用胎压计、便携式称重仪等仪器测量轮胎的荷载和胎压数据并记录,与采集到的轮胎图像进行一一对应,作为后续进行神经网络训练时轮胎轮廓图像的两个标签。
优选地,针对不同的车型,本实施例分别构建数据集并训练深度学习网络模型;且在后续将待预测的预处理图像输入对应的深度学习网络模型之前,先根据该预处理图像所识别的车型进行深度学习网络模型匹配。例如:相关车厢的划分可划分为:轿车、客车、轻型卡车和重型卡车共四种常见车型。
作为一种变形,本实施例也可针对轮胎外径和/或内径不同的区间范围,分别构建数据集并训练深度学习网络模型;且在将待预测的预处理图像输入对应的深度学习网络模型之前,先根据该预处理图像的轮胎轮廓的计算值进行深度学习网络模型匹配。其中,轮胎轮廓的外径和/或内径的计算可参照CN114202572A专利申请,为现有技术,不做赘述。
此外,在具体地实施过程中,基于在不同距离下拍摄同一个轮胎,得到的轮胎图像也是不一样的,即轮胎的半径或者直径的像素点数量也不一样。针对距离带来的影响,可以对采集的轮胎图像进行归一化处理。例如,该归一化处理的具体做法为:若以距离为2米时所拍摄图像的轮胎半径/直径像素点数量作为标准,就假定是120个像素点,假如在其他距离时拍出来的像素点数量是150个,那就需要乘一个0.8的系数;再比如另一距离时拍出来的像素点数量是200个,那就乘以0.6系数,通过把距离和归一化系数联系起来,尽可能消除不同距离(具体值的测定可借助雷达或激光测距装置予以辅助)拍摄所带来的对轮胎轮廓图像的影响。其中,在像素数量归一化处理的过程中,可通过插值算法对图像的颜色分量进行相应处理,此为本领域技术人员熟知的现有技术,不做赘述。作为变通,本实施例在具体实施过程中,也可以通过限位标志使得所采集的图像像素点数量基本接近。
步骤S2、通过语义分割网络将所采集的轮胎图像分割成轮胎、轮辋和背景三个区域,然后通过亚像素级边缘检测算法处理轮胎与背景交界处的轮廓图像,得到预处理图像。
在该步骤中,语义分割的具体实现可采用下述方式:
以U-net为主干网络,引入了迁移学习(transfer learning)、膨胀卷积(dilatedconvolution)和注意力机制(attention mechanism)三个模块构成语义分割网络(Tire-net),如图2所示,以此将轮胎图像分为三个区域,即轮胎、轮辋和背景。
其中,U-net是一种经典的分割网络,它能够在上采样过程中保留大量的特征,并将上下文信息传播到更高分辨率的层,这有利于识别精细目标。此外,与其他网络相比,U-net具有网络结构简单、训练时间短等优点。因此,本实施例选择以U-net为主干网络,引入了迁移学习(transfer learning)、膨胀卷积(dilated convolution)和注意力机制(attention mechanism)三个模块的Tire-net作为语义分割网络,从而实现对轮胎图像的分割。在模型训练过程中,若使用U-net从头进行训练,网络需要大量轮胎图像,这会导致训练时间长、识别精度低等问题。因此,引入迁移学习模块,将包含20000多个不同类别的1400多万幅图像的ImageNet数据集预先训练的部分参数用于轮胎网络。迁移学习模块可以缩短网络训练时长,提高图像分割精度。
在图像特征提取过程中,由于轮胎和轮辋边缘在图像中所占比例很小,卷积层和池化层中的边缘特征容易丢失,这将导致轮胎区域分割不准确。因此,引入膨胀卷积模块来提供轮胎图像的多尺度感受野。膨胀卷积模块可以在不增加训练参数的情况下扩大感受野的范围,有利于轮胎图像多尺度特征的识别。
在轮胎网络下采样过程中引入了迁移学习和膨胀卷积模块,可以有效地提取轮胎图像的多尺度特征,但上采样过程中仍然存在噪声、背景干扰等冗杂信息。因此,引入注意力机制模块,通过调整图像特征的权重向量来消除这些冗杂信息。
在该步骤中,亚像素级边缘检测算法目前可归纳为三种类型,即矩方法、插值法和拟合法。传统的基于Zernike矩的算法采用两灰度边缘模型,如图3(a)所示。但该模型忽略了边缘灰度值的逐渐变化,导致检测结果错误,影响检测精度。因此本实施例采用基于Zernike矩改进算法的斜坡-灰度边缘模型,如图3(b)所示。
本实施例亚像素级边缘检测算法采用斜坡-灰度边缘模型,如图3(b)所示,其中是原点;/>是背景灰度值;/>是过渡灰度值;/>是目标灰度值;/>是理想边缘;/>和/>是不同阶的Zernike矩的边缘。具体包括:
将二维图像的Zernike矩由单位圆上的一组Zernike全正交多项式定义,表示为:
其中,是连续图像强度函数,/>和/>是图像中像素的行数和列数,/>是Zernike多项式的复共轭/>,并且/>定义为:
其中,为非负整数,/>为整数,且满足/>,/>等于偶数,/>是满足的整数,/>,/>,/>;
由于Zernike矩具有正交性和旋转不变性,当图像通过进行旋转时,旋转后的的Zernike矩与原始/>的Zernike矩之间的关系为:
联立可算得各参数分别为:
,/>,/>
其中,和/>分别是/>的虚部和实部,/>是三阶一阶Zernike矩;/>和/>为不同阶Zernike矩的理想边缘和原点之间的距离,/>为理想边缘和原点之间的距离,考虑Zernike矩的/>模板放大效应,得到亚像素坐标/>和原点/>之间的关系:
其中,是Zernike矩模板的大小。
如图4所示:图4(a)为像素级边缘提取结果,图4(b)为亚像素级边缘提取结果。结果表明,轮胎和轮辋在亚像素级的边缘比像素级的边缘更光滑、更接近实际边缘。
优选地,为进一步提高预测精度,还可以将亚像素级边缘检测算法延伸至处理轮胎与轮辋交界处的轮廓图像。此类变形属于本领域技术人员所能轻易想到的,皆属于本发明保护范畴。
步骤S3、将所述预处理图像输入训练好的深度学习网络模型中,得到荷载和胎压所分别对应的预测值。
本实施例中,所述深度学习网络模型以经过上述步骤S1和步骤S2预处理后的图像进行训练,所对应的数据集中录入各图像所分别对应的荷载真实的标签值和胎压真实的标签值,且在训练的迭代过程中,将荷载标签和胎压标签对应的任务均设为回归任务,所述深度学习网络模型总的损失函数根据荷载回归损失函数和胎压回归损失函数所分别对应的权重进行融合计算。
本实施例中,在获得经亚像素级边缘检测处理过的轮胎轮廓图像后,将其作为输入,图像所对应的荷载和胎压为标签,进行网络训练,从而获得荷载和胎压双输出深度学习网络模型。
在构建神经网络训练时,可以采用多种不同的神经网络,如AlexNet、GoogLeNet、VGGNet、ResNet等。本实施例构建的多输出深度神经网络模型采用的是VGG16网络结构,原始的VGG16网络共包含13个卷积层(Convolutional Layer),3个全连接层(FullyConnected Layer),以及5个池化层(Pooling Layer)。其中,卷积层和全连接层具有权重系数,因此也被称为权重层。结合本实施例的具体应用场景,如图5所示,对VGG16网络结构做下述改进及优化:
一、为完成对轮胎荷载和胎压的预测,将原始的VGG16分类模型更改为回归模型,并且更改输出通道数。即去掉VGG16最后一层Softmax层,并在最后一层全连接层后加入三个隐藏层和一个输出层,其中,隐藏层的神经元数分别为256、64和16,最后的输出层单元数为2,对应于荷载和胎压。
二、为了加快训练速度,避免过拟合,可以在卷积层之前进行归一化,即在每个卷积层之前加入一个Batch Normalization(BN)层。由于深层神经网络在做非线性变换前的激活输入值随着网络加深或在训练过程中,其分布逐渐发生偏移或者变动,整体分布逐渐往非线性函数的取值区间的上下限两端靠近,这导致反向传播时低层神经网络的梯度消失,所以训练收敛速度较慢。而BN是通过规范化手段,把每层神经网络任意神经元的输入值的分布强行拉回到均值为0,方差为1的标准正态分布,使梯度变大,避免产生梯度消失问题,梯度变大也意味着学习收敛速度快,能大幅加快训练速度。
三、该网络模型的输入为轮胎轮廓图像,有两个标签,分别是对应的轮胎荷载和胎压。两个标签对应的任务均为回归任务,采用MSEloss损失函数,其公式为:
其中,为实际输出值,/>为期望输出值。
最终损失计算公式为:
其中,为荷载回归任务计算的损失,/>为荷载回归任务损失的权重,/>为胎压回归任务计算的损失,/>为胎压回归任务损失的权重;/>为模型融合后总的损失函数;且/>与/>的计算同/>,下标仅用于区分不同的标签。在VGG16的训练过程,可结合经验及对比试验结果确定两个回归损失函数在训练中所占权重。
在模型训练过程中,改进后的VGG16网络模型输出的荷载和胎压两个结果与真实标签值通过MSEloss损失函数计算误差,由二者加权获得总误差,根据误差反向传播算法更新深度神经网络模型参数。
实施例2
与上述实施例相对应的,本实施例公开一种基于图像识别的车辆胎压与重量联合预测系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中方法相对应的系列步骤。
综上,本发明上述实施例所公开的方法及系统,其至少具有以下有益效果:
1、不依靠任何接触式设备,仅通过图像采集及相应处理就能实现轮胎荷载和胎压的非接触式双预测。
2、亚像素是比像素还小的单位,它将像素这个基本单位再进行细分,从而提高了图像分辨率。本发明将亚像素边缘检测算法用于理轮胎与背景交界处的轮廓图像的处理,提高了训练模型的精度和预测结果的可靠性。
3、语义分割是计算机视觉中的基本任务,在语义分割中我们需要将视觉输入分为不同的语义可解释类别,“语义的可解释性”即分类类别在真实世界中是有意义的。例如,我们可能需要区分图像中属于汽车的所有像素,并把这些像素涂成蓝色。与图像分类或目标检测相比,语义分割使我们对图像有更加细致的了解。因此,本发明将语义分割与深度学习网络模型结合,实现了对轮胎荷载和胎压预测精度的提升。
4、深度学习网络模型在训练和测试中,其总的损失函数根据荷载回归损失函数和胎压回归损失函数所分别对应的权重进行融合计算,符合荷载和胎压之间存在直接关联关系的事实逻辑,提高了本发明模型双输出结果的预测可靠性。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于图像识别的车辆胎压与重量联合预测方法,其特征在于,包括:
步骤S1、采集轮胎图像;
步骤S2、通过语义分割网络将所采集的轮胎图像分割成轮胎、轮辋和背景三个区域,然后通过亚像素级边缘检测算法处理轮胎与背景交界处的轮廓图像,得到预处理图像;
步骤S3、将所述预处理图像输入训练好的深度学习网络模型中,得到荷载和胎压所分别对应的预测值;
其中,所述深度学习网络模型以经过上述步骤S1和步骤S2预处理后的图像进行训练,所对应的数据集中录入各图像所分别对应的荷载真实的标签值和胎压真实的标签值,且在训练的迭代过程中,将荷载标签和胎压标签对应的任务均设为回归任务,所述深度学习网络模型总的损失函数根据荷载回归损失函数和胎压回归损失函数所分别对应的权重进行融合计算。
2.根据权利要求1所述的方法,其特征在于,还包括:
针对轮胎外径和/或内径不同的区间范围,分别构建数据集并训练深度学习网络模型;且在将待预测的预处理图像输入对应的深度学习网络模型之前,先根据该预处理图像轮胎轮廓的计算值进行深度学习网络模型匹配。
3.根据权利要求1所述的方法,其特征在于,还包括:
针对不同的车型,分别构建数据集并训练深度学习网络模型;且在将待预测的预处理图像输入对应的深度学习网络模型之前,先根据该预处理图像所识别的车型进行深度学习网络模型匹配。
4.根据权利要求1、2或3所述的方法,其特征在于,所述深度学习网络模型采用VGG16网络结构。
5.根据权利要求4所述的方法,其特征在于,所述VGG16网络结构省略softmax层,并在最后一层全连接层加入三个隐藏层和一个输出层,隐藏层的神经元个数分别为256、64和16,输出层单元数为2,且在每一个卷积层之前加入一个Batch Normalization层。
6.根据权利要求1、2或3所述的方法,其特征在于,所述亚像素级边缘检测算法采用斜坡-灰度边缘模型,具体包括:
将二维图像的Zernike矩由单位圆上的一组Zernike全正交多项式定义,表示为:
其中,是连续图像强度函数,/>和/>是图像中像素的行数和列数,/>是Zernike多项式的复共轭/>,并且/>定义为:
其中,为非负整数,/>为整数,且满足/>,/>等于偶数,/>是满足的整数,/>,/>,/>;
由于Zernike矩具有正交性和旋转不变性,当图像通过进行旋转时,旋转后的的Zernike矩与原始/>的Zernike矩之间的关系为:
联立可算得各参数分别为:
,/>,/>
其中,和/>分别是/>的虚部和实部,/>是三阶一阶Zernike矩;/>和/>为不同阶Zernike矩的理想边缘和原点之间的距离,/>为理想边缘和原点之间的距离,考虑Zernike矩的/>模板放大效应,得到亚像素坐标/>和原点/>之间的关系:
其中,是Zernike矩模板的大小。
7.一种基于图像识别的车辆胎压与重量联合预测系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至6任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310624848.0A CN116843895A (zh) | 2023-05-30 | 2023-05-30 | 一种基于图像识别的车辆胎压与重量联合预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310624848.0A CN116843895A (zh) | 2023-05-30 | 2023-05-30 | 一种基于图像识别的车辆胎压与重量联合预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116843895A true CN116843895A (zh) | 2023-10-03 |
Family
ID=88158980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310624848.0A Pending CN116843895A (zh) | 2023-05-30 | 2023-05-30 | 一种基于图像识别的车辆胎压与重量联合预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116843895A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117237441A (zh) * | 2023-11-10 | 2023-12-15 | 湖南科天健光电技术有限公司 | 亚像素定位方法、系统、电子设备和介质 |
-
2023
- 2023-05-30 CN CN202310624848.0A patent/CN116843895A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117237441A (zh) * | 2023-11-10 | 2023-12-15 | 湖南科天健光电技术有限公司 | 亚像素定位方法、系统、电子设备和介质 |
CN117237441B (zh) * | 2023-11-10 | 2024-01-30 | 湖南科天健光电技术有限公司 | 亚像素定位方法、系统、电子设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11093799B2 (en) | Rare instance classifiers | |
CN111274843B (zh) | 基于监控视频的货车超载监测方法及系统 | |
CN113033284B (zh) | 一种基于卷积神经网络的车辆实时超载检测方法 | |
US9234800B2 (en) | Spectrometer | |
CN104160258A (zh) | 用于估计车辆轮胎的气压状态的系统和方法 | |
CN111652295B (zh) | 一种铁路货车钩尾销托梁脱落故障识别方法 | |
CN116843895A (zh) | 一种基于图像识别的车辆胎压与重量联合预测方法及系统 | |
CN111339830A (zh) | 一种基于多模态数据特征的目标分类方法 | |
CN111735524A (zh) | 基于图像识别的轮胎荷载获取方法、车辆称重方法及系统 | |
CN112084890A (zh) | 基于gmm和cqfl的多尺度识别交通信号标志的方法 | |
CN114092683A (zh) | 基于视觉反馈和深度网络的轮胎变形量识别方法及装置 | |
CN116738211A (zh) | 一种基于多源异构数据融合的道路状况识别方法 | |
CN111062093A (zh) | 一种基于图像处理和机器学习技术的汽车轮胎寿命预测方法 | |
CN102043941B (zh) | 动态实时相对关系识别方法与系统 | |
KR101887438B1 (ko) | 공기압 저하 판단 장치 및 방법 | |
Singh et al. | Application of machine learning & deep learning techniques in the context of use cases relevant for the tire industry | |
Zhang et al. | A comparative analysis of object detection algorithms in naturalistic driving videos | |
xi Wang et al. | Detection of MMW radar target based on doppler characteristics and deep learning | |
CN111950478B (zh) | 一种动态平板秤称重区域汽车s型行驶行为检测方法 | |
CN111626175B (zh) | 基于深度卷积神经网络的轴型识别方法 | |
Wang et al. | Road Surface Recognition Based on Vision and Tire Noise | |
KR102610968B1 (ko) | 도로 내 포트홀의 유무 및 위험도와 종단 평탄성을 추정하고 기록하는 방법 및 시스템 | |
CN114202927B (zh) | 一种基于多传感器融合的车型检测方法 | |
KR102456621B1 (ko) | 공기입 타이어 모니터링 시스템 및 이를 이용한 공기입 타이어 모니터링 방법 | |
Zhang et al. | Non-contact weigh-in-motion approach with an improved multi-region of interest method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |