CN113793327B

CN113793327B - 一种基于token的高铁异物检测方法

Info

Publication number: CN113793327B
Application number: CN202111110860.7A
Authority: CN
Inventors: 齐志泉
Original assignee: Beijing Zhongkezhiyan Technology Co ltd
Current assignee: Beijing Zhongkezhiyan Technology Co ltd
Priority date: 2021-09-18
Filing date: 2021-09-18
Publication date: 2023-12-26
Anticipated expiration: 2041-09-18
Also published as: CN113793327A

Abstract

本发明公开了一种基于token的高铁异物检测方法，包括如下步骤：S1、通过对给定的数据集进行数据预处理，得到预处理图像；S2、通过自编码器对预处理图像进行特征提取，得到图像特征；S3、通过高斯混合模型对提取的图像特征进行特征聚类及特征标志选取，得到异物的不同类别；S4、将异物的不同类别的异物图像分到不同的数据集，通过yolov5目标检测算法训练单独的目标检测模型，得到预测新数据模型；S5、通过预测新数据模型对异物进行异物检测，判断是否存在异物；本发明主要是通过token和目标检测的结合，既解决了基于单一目标检测方法的异物检测泛化性差的问题，又解决了基于语义分割模型的异物检测方法的效率低下问题。

Description

一种基于token的高铁异物检测方法

技术领域

本发明属于高铁维护技术领域，具体涉及一种基于token的高铁异物检测方法。

背景技术

高铁在运行过程中可能会出现部件故障或被异物粘附的情况，这极大的增加了安全隐患，严重的威胁到了乘务员及乘客的生命财产安全。因此，在高铁运行时对其进行实时的异物检测是非常有必要的。异物检测就是对非正常形态的部件以及对正常形态的部件上附着的异物进行的检测。现有的异物检测方法主要有三种：人工检测，基于目标检测算法的异物检测，以及基于语义分割模型的异物检测。

给定一个高铁运行过程中的实时监测图像集或视频集，人工检测就是聘请专业的质量检测人员对图像或视频进行异物排查和人工标注；基于目标检测算法的异物检测主要通过训练Fast RCNN、Yolo等目标检测算法，生成目标检测模型，实现对异物的自动识别；基于语义分割模型的异物检测则主要依靠现有的语义分割模型，对需要进行异物识别的图像或视频进行像素级的标签预测，将其分割成多块区域，并根据每块区域的形状判断是否存在异物。

但是，由于对高铁的异物检测要求同时具备实时性和准确性，而人工检测完全达不到实时性的要求，准确率也可能比相应的深度学习算法低，因此，这种检测方法将被逐渐淘汰。基于目标检测算法的异物检测虽然依靠基于机器学习的目标检测算法，然而，由于异物形状的多样性和不确定性，这种依靠单一目标识别算法的检测方法往往只能识别特定形状的异物，得不到令人满意的效果。基于语义分割模型的异物检测则需要给每个像素分配标签，计算量大，在实际应用中很难满足实时检测的要求，因此我们需要提出一种基于token的高铁异物检测方法。

发明内容

本发明的目的在于提供一种基于token的高铁异物检测方法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明采用了如下技术方案：

一种基于token的高铁异物检测方法，包括如下步骤：

S1、通过对给定的数据集进行数据预处理，得到预处理图像；

S2、通过自编码器对预处理图像进行特征提取，得到图像特征；

S3、通过高斯混合模型对提取的图像特征进行特征聚类及特征标志选取，得到异物的不同类别；

S4、将异物的不同类别的异物图像分到不同的数据集，通过yolov5目标检测算法训练单独的目标检测模型，得到预测新数据模型；

S5、通过预测新数据模型对异物进行异物检测，判断是否存在异物。

优选的，步骤1中所述数据集为RGB图像集，尺寸不一，在对数据集处理时，先通过OpenCV的resize()函数将图像调整为统一尺寸，再用copyMakeBorder()函数对图像进行边界填充，方便后续的卷积处理，再通过将图像随机旋转90°、180°或270°，以及对图像进行0.7-1.3倍的尺度间缩放。

优选的，步骤2中所述自编码器由编码器和解码器组成，编码器是一个多层全连接神经网络，每层的神经元数目逐渐减少，它的作用是对输入图像进行特征提取和压缩，输入图像在经过编码器后会被提取出一个压缩的特征向量；解码器的作用则是监督编码器，促使编码器提取出最具有代表性的特征向量；解码器也是一个多层全连接神经网络，与编码器对称，它每层的神经元数目逐渐增多，最终根据编码器编码的特征向量还原出原来的输入图像；使解码器还原出来的图像与输入编码器的图像接近，就能保证提取的特征向量是具有代表性的。

优选的，步骤3中所述特征聚类时需先在图像特征数据中随机选取K个点作为聚类中心，初始化每个簇的参数π_k，μ_k，和∑_k，对于剩下的点x_n，使用公式分别计算每个点由每个聚类中心生成的概率，即为E步，接着，使用计算的γ(z_nk)更新π_k，μ_k，和∑_k的值，即为M步：

重复上述E步和M步的过程，直至参数收敛，即到了异物的不同类别，且每个类别以簇中心作为token。

优选的，步骤4中所述目标检测模型训练时先根据步骤3得到的聚类结果将不同类别的异物图像分到不同的数据集，对于每个异物类别分别训练单独的目标检测模型，训好后将模型固定，用于后续预测新数据。

优选的，步骤5中所述异物检测时对于需要进行异物检测的新图像，先调整成统一的尺寸，并使用微调的ResNet50网络提取特征，再根据公式计算新图像属于各个类别的概率，将其归于概率最大的一类，使用概率最大类别下训练的目标检测模型对其进行异物检测。

优选的，检测到的异物新图像与各类别之间的距离较大时，视此异物为新的类别，暂存到数据集中，等数据较多时再单独训练目标检测模型。

优选的，在对异物判断时，若存在异物故障系统将进行警告作业，若不存在异物，故障系统则处于待命状态。

本发明提出的一种基于token的高铁异物检测方法，与现有技术相比，具有以下优点：

本发明主要是给定一个异物图像集，先对异物图像进行数据预处理和特征提取，再对获取到的图像特征进行聚类分析，并为每个类别选取一个token作为特征标志，在得到的异物类别的基础上，针对每一类分别训练的目标检测模型，以实现对多形状异物的准确识别，通过token和目标检测的结合，既解决了基于单一目标检测方法的异物检测泛化性差的问题，又解决了基于语义分割模型的异物检测方法的效率低下问题，提高了实际应用中的实时性和准确性。

附图说明

图1为本发明的流程框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供了如图1所示的一种基于token的高铁异物检测方法，包括如下步骤：

其中，数据集为RGB图像集，尺寸不一，在对数据集处理时，先通过OpenCV的resize()函数将图像调整为统一尺寸，再用copyMakeBorder()函数对图像进行边界填充，方便后续的卷积处理，再通过将图像随机旋转90°、180°或270°，以及对图像进行0.7-1.3倍的尺度之间的缩放等处理，进一步对图像做数据增广。

其中，所述自编码器由编码器和解码器组成，编码器是一个多层全连接神经网络，每层的神经元数目逐渐减少，它的作用是对输入图像进行特征提取和压缩，输入图像在经过编码器后会被提取出一个压缩的特征向量；解码器的作用则是监督编码器，促使编码器提取出最具有代表性的特征向量；解码器也是一个多层全连接神经网络，与编码器对称，它每层的神经元数目逐渐增多，最终根据编码器编码的特征向量还原出原来的输入图像；使解码器还原出来的图像与输入编码器的图像接近，就能保证提取的特征向量是具有代表性的。

其中，特征聚类时需先在图像特征数据中随机选取K个点作为聚类中心，初始化每个簇的参数π_k，μ_k，和∑_k，对于剩下的点x_n，使用公式分别计算每个点由每个聚类中心生成的概率，即为E步，接着，使用计算的γ(z_nk)更新π_k，μ_k，和∑_k的值，即为M步：

在目标检测模型训练时先根据步骤3得到的聚类结果将不同类别的异物图像分到不同的数据集，对于每个异物类别分别训练单独的目标检测模型，训好后将模型固定，用于后续预测新数据。

S5、通过预测新数据模型对异物进行异物检测，判断是否存在异物；

在异物检测时对于需要进行异物检测的新图像，先调整成统一的尺寸，并使用微调的ResNet50网络提取特征，再根据公式计算新图像属于各个类别的概率，将其归于概率最大的一类，使用概率最大类别下训练的目标检测模型对其进行异物检测，如果检测到的异物新图像与各类别之间的距离较大时，视此异物为新的类别，暂存到数据集中，等数据较多时再单独训练目标检测模型，在判断新图像与各类别之间的距离时，根据不同异物的实际大小判定，距离超过异物本身大小的三分之一时视为较大距离。

通过给定一个异物图像集，先对异物图像进行数据预处理和特征提取，再对获取到的图像特征进行聚类分析，从而得到异物的不同类别，并为每个类别选取特定的token，接着，针对每个异物类别分别训练目标检测模型，以实现对多形状异物的准确识别，通过token和目标检测的结合，既解决了基于单一目标检测方法的异物检测泛化性差的问题，又解决了基于语义分割模型的异物检测方法的效率低下问题，提高了实际应用中的实时性和准确性。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于token的高铁异物检测方法，其特征在于：包括如下步骤：

所述数据集为RGB图像集，尺寸不一，在对数据集处理时，先通过OpenCV的resize()函数将图像调整为统一尺寸，再用copyMakeBorder()函数对图像进行边界填充，方便后续的卷积处理，再通过将图像随机旋转90°、180°或270°，以及对图像进行0.7-1.3倍的尺度间缩放；

所述特征聚类时需先在图像特征数据中随机选取K个点作为聚类中心，初始化每个簇的参数π_k，μ_k，和∑_k，对于剩下的点x_n，使用公式分别计算每个点由每个聚类中心生成的概率，即为E步，接着，使用计算的γ(z_nk)更新π_k，μ_k，和∑_k的值，即为M步：

重复上述E步和M步的过程，直至参数收敛，即到了异物的不同类别，且每个类别以簇中心作为token；

所述异物检测时对于需要进行异物检测的新图像，先调整成统一的尺寸，并使用微调的ResNet50网络提取特征，再根据公式计算新图像属于各个类别的概率，将其归于概率最大的一类，使用概率最大类别下训练的目标检测模型对其进行异物检测。

2.根据权利要求1所述的一种基于token的高铁异物检测方法，其特征在于：步骤2中所述自编码器由编码器和解码器组成，编码器是一个多层全连接神经网络，每层的神经元数目逐渐减少，它的作用是对输入图像进行特征提取和压缩，输入图像在经过编码器后会被提取出一个压缩的特征向量；解码器的作用则是监督编码器，促使编码器提取出最具有代表性的特征向量；解码器也是一个多层全连接神经网络，与编码器对称，它每层的神经元数目逐渐增多，最终根据编码器编码的特征向量还原出原来的输入图像；使解码器还原出来的图像与输入编码器的图像接近，就能保证提取的特征向量是具有代表性的。

3.根据权利要求2所述的一种基于token的高铁异物检测方法，其特征在于：步骤4中所述目标检测模型训练时先根据步骤3得到的聚类结果将不同类别的异物图像分到不同的数据集，对于每个异物类别分别训练单独的目标检测模型，训好后将模型固定，用于后续预测新数据。

4.根据权利要求3所述的一种基于token的高铁异物检测方法，其特征在于：检测到的异物新图像与各类别之间的距离较大时，视此异物为新的类别，暂存到数据集中，等数据较多时再单独训练目标检测模型。

5.根据权利要求4所述的一种基于token的高铁异物检测方法，其特征在于：在对异物判断时，若存在异物故障系统将进行警告作业，若不存在异物，故障系统则处于待命状态。