CN111563886A - 基于非监督特征学习的隧道钢轨表面病害检测方法及装置 - Google Patents

基于非监督特征学习的隧道钢轨表面病害检测方法及装置 Download PDF

Info

Publication number
CN111563886A
CN111563886A CN202010359051.9A CN202010359051A CN111563886A CN 111563886 A CN111563886 A CN 111563886A CN 202010359051 A CN202010359051 A CN 202010359051A CN 111563886 A CN111563886 A CN 111563886A
Authority
CN
China
Prior art keywords
training
steel rail
data set
layer
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010359051.9A
Other languages
English (en)
Other versions
CN111563886B (zh
Inventor
程腾
谷先广
廖正京
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Guoju Construction Machinery Technology Co ltd
Original Assignee
Anhui Guoju Construction Machinery Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Guoju Construction Machinery Technology Co ltd filed Critical Anhui Guoju Construction Machinery Technology Co ltd
Priority to CN202010359051.9A priority Critical patent/CN111563886B/zh
Publication of CN111563886A publication Critical patent/CN111563886A/zh
Application granted granted Critical
Publication of CN111563886B publication Critical patent/CN111563886B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30136Metal

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于非监督特征学习的隧道钢轨表面病害检测方法及装置。该方法包括:采集铁路隧道的多张钢轨表面样本图像并扩充至样本数据集;对样本数据集进行预处理,并划分为训练数据集与测试数据集;先提取特征,再进行重构以训练出特征提取器;通过特征提取器建立训练模型;对训练模型进行编译,并将数据投喂至训练网络中进行训练;先在特征提取器中加入训练网络的全连接层,再在全连接层后添加归一化指数函数层,最后将得分最大的样本所对应的类别作为训练网络预测出的类别;验证训练模型,是则模型有效,否则重新对特征提取器进行训练。本发明使检测效率和检测精度大幅提升,减轻人工劳动强度并降低成本,扩充铁路隧道检测数据。

Description

基于非监督特征学习的隧道钢轨表面病害检测方法及装置
技术领域
本发明涉及铁路隧道技术领域的一种隧道钢轨表面病害检测方法,尤其涉及一种基于非监督特征学习的隧道钢轨表面病害检测方法,还涉及应用该方法的基于非监督特征学习的隧道钢轨表面病害检测装置。
背景技术
随着我国隧道建设的飞速发展,目前我国隧道已经走出建设期,迈入“高维修”管理期,隧道病害对隧道的运营安全的影响越来越引起相关部门的重视,而对隧道钢轨病害的检测与管理是隧道维护的一个重点。为了确保隧道不会对列车的安全运行产生影响,需要对钢轨进行定期的安全性检测,对病害严重的隧道钢轨需要不定时的进行检测观察。
在现有的隧道养护检测过程中,铁路隧道(其包括地铁隧道、高铁隧道、普快铁路隧道等)均存在钢轨表面病害情况,而为了能够将病害区域及时检测出来,通常需要人为对铁路隧道进行定期检测和养护。例如,通过人工打标签的方式进行处理。但是,现有的这种钢轨表面病害检测方法通过普通的人工检测方式或依靠人工仪器进行,这样会造成以下这些问题:1、检测效率低,由于人工检测或通过仪器检测需要人为进行操作,需要耗费大量时间进行实地采样和计算,检测效率不能满足需求;2、检测精度低,这是由于人工检测或通过仪器测量存在测量误差,使得最终的测量结果存在较大的误差值;3、目前钢轨表面病害图像数据集资源不足,而且人工打标签成本昂贵。
发明内容
为解决现有的隧道钢轨表面病害检测存在检测效率和精度较低,而且数据资源不足,通过人工打标签成本昂贵的技术问题,本发明提供一种基于非监督特征学习的隧道钢轨表面病害检测方法及装置。
本发明采用以下技术方案实现:一种基于非监督特征学习的隧道钢轨表面病害检测方法,其包括以下步骤:
(1)采集铁路隧道的多张钢轨表面样本图像,并将多张钢轨表面样本图像扩充至样本数据集;
(2)对所述钢轨表面样本图像进行预处理,以将所述样本数据集划分为训练数据集与测试数据集;
(3)先提取所述训练数据集的数据的特征,再对提取特征进行重构以训练出特征提取器;
(4)设定所述特征提取器的训练参数,并通过所述特征提取器建立训练模型;
(5)对所述训练模型进行编译,并将所述训练数据集的数据投喂至所述训练模型的训练网络中以进行训练;
(6)先在所述特征提取器中加入所述训练网络的全连接层,并设置节点个数为钢轨表面病害的类别数,再在所述训练网络的全连接层后添加归一化指数函数层,并对所述训练数据集中每个样本的输出得分进行映射,最后将得分最大的样本所对应的类别作为所述训练网络预测出的类别;
(7)先将所述测试数据集的数据输入至所述训练模型中,再将所述训练网络的输出结果与预设的人工判断结果相对比,最后根据对比结果计算所述测试数据集中分类的正确率,并判断所述正确率是否达到一个预设精度;在所述正确率达到所述预设精度时,通过所述训练模型分类钢轨表面样本图像数据以确定隧道钢轨表面病害;在所述正确率未达到所述预设精度时,执行步骤(3)。
本发明首先检测钢轨表面样本图像并扩充至样本数据集,其次对数据进行预处理并分为训练数据集和测试数据集,而后提取特征并对特征进行重构以训练出特征提取器,随后设定训练参数并建立训练模型,然后对模型进行编译并将训练数据集中数据输入模型训练,再然后通过添加全连接层等对训练模型进行融合,并将得分最大的样本所对应的样本类别作为训练网络预测的类别,最后将测试数据集的数据输入至训练模型中以预测类别,并将预测的类别与人工判断结果进行对比以计算出分类的正确率,通过将正确率与预设精度比较的方式确定训练模型是否有效,是则实现对钢轨表面病害的判别检测,否则重新训练特征提取器,这样最终可以实现隧道钢轨表面病害的检测,解决了现有的隧道钢轨表面病害检测存在检测效率和精度较低,而且数据资源不足,通过人工打标签成本昂贵的技术问题,得到了检测效率高,检测精度准,并且能够产生大量的钢轨表面病害图像数据集资源,并且避免人工打标,进而能够减轻人工劳动强度技术效果。
作为上述方案的进一步改进,每个样本的输出得分的计算公式为:
Figure BDA0002474434560000031
式中,score为输出得分,n为所述训练数据集中样本总数,i为当前样本的序列。
作为上述方案的进一步改进,所述钢轨表面样本图像的预处理方法包括:
(2.1)剪去所述钢轨表面样本图像中钢轨边缘意外的部分;
(2.2)对(2.1)剪裁后的钢轨表面样本图像进行灰度处理和中值滤波;
(2.3)将(2.2)处理后的样本数据集划分为训练数据集与测试数据集。
作为上述方案的进一步改进,训练所述特征提取器的方法包括以下步骤:
(3.1)将所述训练数据集的数据送入输入层,所述训练数据集表示为X={x1,x2,x3,L,xn},式中n为训练数据集的样本总数;
(3.2)定义编码层和解码层中每个节点的函数表达式为hi={f(x1),f(x2),f(x3),L,f(xn)},式中f为映射函数,i为当前样本的序列;
(3.3)通过编码器的隐藏层提取所述训练数据集的数据的特征;
(3.4)通过解码器对提取特征进行重构输入
Figure BDA0002474434560000032
(3.5)最小化原始输入和重构输入之间的误差,并判断所述误差是否达到一个预设收敛精度;
在所述误差达到预设收敛精度时,将所述编码器作为所述特征提取器;
在所述误差未达到所述预设收敛精度时,执行步骤(3.1)。
进一步地,所述编码器的第一层为全连接层,且设置256个节点,并用于接收所述编码器的输入层的数据;所述编码器的第二层为全连接层,且设置64个节点,并用于接收所述编码器的第一层的输出数据;所述编码器的第三层为全连接层,且设置2个节点,并用于接收所述编码器的第二层的输出数据;所述解码器的第一层为全连接层,且设置64个节点,并用于接收所述解码器的输入层的数据;所述解码器的第二层为全连接层,且设置256个节点,并用于接收所述解码器的第一层的输出数据;所述解码器的第三层为全连接层,且设置128个节点,并用于接收所述解码器的第二层的输出数据。
再进一步地,在步骤(4)中,
将所述编码器和所述解码器的前两层的激活函数设置为:
RELU=max{0,x}
将所述解码器的第三层的激活函数设置为:
Figure BDA0002474434560000041
将损失函数设置为:
Figure BDA0002474434560000042
其中,n为所述训练数据集中样本总数,
Figure BDA0002474434560000043
为所述训练网络的预测输出,yi为所述训练模型的训练集原始输入。
作为上述方案的进一步改进,在步骤(1)中,通过至少一个动态检测小车在所述铁路隧道内运动以使位于所述动态检测小车上的相机拍摄所述钢轨表面样本图像,并在所述铁路隧道中光线强度未达到预设光强时通过辅助光源增加所述铁路隧道的钢轨表面亮度。
作为上述方案的进一步改进,在不同地点、天气、光线条件下重复进行步骤(1),并对所述钢轨表面样本图像进行旋转、缩放、平移以及添加噪声,以扩充所述样本数据集,使所述样本数据集中的图像数量大于5000张。
作为上述方案的进一步改进,使用开源人工神经网络库keras中的model.compile函数对所述训练模型进行编译,使用model.fit函数对所述训练模型进行训练。
本发明还提供一种基于非监督特征学习的隧道钢轨表面病害检测装置,其应用上述任意所述的基于非监督特征学习的隧道钢轨表面病害检测方法,其包括:
数据采集模块,其用于采集铁路隧道的多张钢轨表面样本图像,并将多张钢轨表面样本图像扩充至样本数据集;
预处理模块,其用于对所述钢轨表面样本图像进行预处理,以将所述样本数据集划分为训练数据集与测试数据集;
特征提取器训练模块,其用于先提取所述训练数据集的数据的特征,再对提取特征进行重构以训练出特征提取器;
模型建立模块,其用于设定所述特征提取器的训练参数,并通过所述特征提取器建立训练模型;
编译训练模块,其用于对所述训练模型进行编译,并将所述训练数据集的数据投喂至所述训练模型的训练网络中以进行训练;
类别识别模块,其用于先在所述特征提取器中加入所述训练网络的全连接层,并设置节点个数为钢轨表面病害的类别数,再在所述训练网络的全连接层后添加归一化指数函数层,并对所述训练数据集中每个样本的输出得分进行映射,最后将得分最大的样本所对应的类别作为所述训练网络预测出的类别;以及
病害检测模块,其用于先将所述测试数据集的数据输入至所述训练模型中,再将所述训练网络的输出结果与预设的人工判断结果相对比,最后根据对比结果计算所述测试数据集中分类的正确率,并判断所述正确率是否达到一个预设精度;在所述正确率达到所述预设精度时,通过所述训练模型分类钢轨表面样本图像数据以确定隧道钢轨表面病害;在所述正确率未达到所述预设精度时,驱使所述特征提取器训练模块工作。
相较于现有的隧道钢轨表面病害检测方法,本发明的基于非监督特征学习的隧道钢轨表面病害检测方法及装置具有以下有益效果:
1、该基于非监督特征学习的隧道钢轨表面病害检测方法,其首先检测钢轨表面样本图像并扩充至样本数据集,其次对数据进行预处理并分为训练数据集和测试数据集,而后提取特征并对特征进行重构以训练出特征提取器,随后设定训练参数并建立训练模型,然后对模型进行编译并将训练数据集中数据输入模型训练,再然后通过添加全连接层等对训练模型进行融合,并将得分最大的样本所对应的样本类别作为训练网络预测的类别,最后将测试数据集的数据输入至训练模型中以预测类别,并将预测的类别与人工判断结果进行对比以计算出分类的正确率,通过将正确率与预设精度比较的方式确定训练模型是否有效,是则实现对钢轨表面病害的判别检测,否则重新训练特征提取器,这样最终可以实现隧道钢轨表面病害的检测。在检测的过程中,由于对数据进行划分和训练,当分类正确率达到要求后才会通过模型检测病害,这样可以使检测精度满足各种要求,同时由于检测过程多为数据处理过程,无需人工到现场进行检测和测量,也无需人员对数据进行统计,这样可以带来以下好处:1、由于检测可以自动化实现,检测效率可以大幅提升;2、在对病害检测的过程中不会出现人工测量误差,检测精度得到大幅提高;3、检测所需的人工劳动较少,可以减轻人工劳动强度,检测工作量降低,可以大批量地对铁路隧道进行检测;4、无需人工打标签,可以降低检测成本;5、检测过程中会产生大量的钢轨表面病害图像数据集资源,可以扩充铁路隧道检测数据。
2、该基于非监督特征学习的隧道钢轨表面病害检测方法,其通过自动编码器最小化原始输入和重构输入之间的误差,通过调节编码器使其达到最佳的特征提取性能,这样在误差优化至满足精度要求,网络收敛时,编码器部分已经能够实现特征提取的功能,此时在编码器的输出层之后加上神经网络中常用于分类的全连接层和归一化指数函数层,实现最终的图片精准分类功能。
3、该基于非监督特征学习的隧道钢轨表面病害检测方法,其可以通过同步触发器打开相机及其辅助光源,随着动态检测小车在隧道内的运动,进行钢轨表面样本图像的采集,可以在不同地点、天气、光线等条件下多次重复此步骤,使图像数据集涵盖种类丰富的数据信息,这样可以使训练模型的适应性更强,使检测方法能够检测多种环境的铁路隧道。而且,检测方法对采集到的样本图像进行旋转、缩放、平移、添加噪声等图像处理操作,将图片数量扩充至理想的数据集规模,检测性能更加优越,并提高网络的泛化能力。
4、该基于非监督特征学习的隧道钢轨表面病害检测方法,其在对采样数据预处理时,可以剪去钢轨边缘意外的部分,这样能够有效减小网络计算量,提高训练速度。而且,该检测方法还可以对图像进行灰度处理和中值滤波,这样就能够去除一定的噪声,并且减弱光线等因素的影响,使检测准确性进一步提高。
5、该基于非监督特征学习的隧道钢轨表面病害检测装置,其有益效果与上述基于非监督特征学习的隧道钢轨表面病害检测方法的有益效果相同,在此不再做赘述。
附图说明
图1为本发明实施例1的基于非监督特征学习的隧道钢轨表面病害检测方法的流程图。
图2为本发明实施例1的基于非监督特征学习的隧道钢轨表面病害检测方法的系统流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
实施例1
请参阅图1以及图2,本实施例提供了一种基于非监督特征学习的隧道钢轨表面病害检测方法,该方法可以应用于对高铁隧道、地铁隧道、普通铁路隧道等隧道的检测养护中,能够及时、准确地将铁路隧道钢轨表面的病害检测出来。该隧道钢轨表面病害检测方法以自动编码器作为主要的特征提取工具,结合神经网络进行分类,实现隧道钢轨表面病害的检测,并为隧道养护提供数据支撑。在本实施例中,在本实施例中,硬件检测工具主要有以下:LED辅助光源两个、CCD相机一台、同步触发装置、处理器、支架、电源、动态检测小车一个,而软件实现方式通过Anaconda3+Keras2.0+OpenCV3.0的方式。当然,在其他实施例中,硬件与软件所选择的工具可以与本实施例中的工具不同,具体可以根据实际需要进行确定。其中,该隧道钢轨表面病害检测方法包括以下步骤,即步骤(1)-(7)。
(1)采集铁路隧道的多张钢轨表面样本图像,并将多张钢轨表面样本图像扩充至样本数据集。在本实施例中,通过至少一个动态检测小车在铁路隧道内运动以使位于动态检测小车上的相机拍摄钢轨表面样本图像,并在铁路隧道中光线强度未达到预设光强时通过辅助光源增加铁路隧道的钢轨表面亮度。动态检测小车的数量可以根据实际需要进行选择,当铁路隧道较长并且存在多段时,动态检测小车的数量就可以相应增加,使图像采集效率能够满足实际需要。
为了能够保证采集的数据更加全面,得到更好的性能,并提高后续网络的泛化能力,在不同地点、天气、光线条件下重复进行步骤(1),并对钢轨表面样本图像进行旋转、缩放、平移以及添加噪声,以扩充样本数据集,使样本数据集中的图像数量大于5000张。当然,图像数量也可以低于5000张,具体数量可以根据实际需要进行确定,但是必须保证数据集中数据的全面性和广泛性。
(2)对钢轨表面样本图像进行预处理,以将样本数据集划分为训练数据集与测试数据集。在本实施例中,钢轨表面样本图像的预处理方法包括以下步骤,即步骤(2.1)-(2.3)。
(2.1)剪去钢轨表面样本图像中钢轨边缘意外的部分。本步骤将图像中钢轨边缘以外的多余像素裁剪掉,这样能够有效减小网络计算量,提高训练速度。
(2.2)对(2.1)剪裁后的钢轨表面样本图像进行灰度处理和中值滤波。这样,通过灰度处理和滤波,钢轨表面样本图像中一定的噪声将会被去除,并且能够减弱光线等因素的影响。
(2.3)将(2.2)处理后的样本数据集划分为训练数据集与测试数据集。
(3)先提取训练数据集的数据的特征,再对提取特征进行重构以训练出特征提取器。在本实施例中,训练特征提取器的方法包括以下这些步骤,即步骤(3.1)-(3.5)。其中,钢轨表面病害的检测过程一共经过3次编码和3次解码。
(3.1)按照网络结构的设计,待检测图像经过预处理后,将训练数据集的数据送入输入层,训练数据集表示为X={x1,x2,x3,L,xn},式中n为训练数据集的样本总数。
(3.2)定义编码层和解码层中每个节点的函数表达式为hi={f(x1),f(x2),f(x3),L,f(xn)},式中f为映射函数,i为当前样本的序列,即i用于表示为当前层的第i个节点。具体而言,编码器的第一层为全连接层,且设置256个节点,并用于接收编码器的输入层的数据。编码器的第二层为全连接层,且设置64个节点,并用于接收编码器的第一层的输出数据。编码器的第三层为全连接层,且设置2个节点,并用于接收编码器的第二层的输出数据。解码器的第一层为全连接层,且设置64个节点,并用于接收解码器的输入层的数据。解码器的第二层为全连接层,且设置256个节点,并用于接收解码器的第一层的输出数据。解码器的第三层为全连接层,且设置128个节点,并用于接收解码器的第二层的输出数据。
(3.3)通过编码器的隐藏层提取训练数据集的数据的特征。即,图像的输入X={x1,x2,x3,L,xn}到编码器中后,经过隐藏层H=f(x)而提取特征。
(3.4)通过解码器对提取特征进行重构输入
Figure BDA0002474434560000101
(3.5)最小化原始输入和重构输入之间的误差,来调节编码器使其达到最佳的特征提取性能,并判断误差是否达到一个预设收敛精度。
在误差达到预设收敛精度时,将编码器作为特征提取器。这样,网络收敛并达到理想精度后,保存模型中的编码器部分,作为特征提取器,可以满足需求。
在误差未达到预设收敛精度时,执行步骤(3.1)。
(4)设定特征提取器的训练参数,并通过特征提取器建立训练模型。在本实施例中,所有编码层和解码器前两层激活函数为线性激活函数RELU,即设置为:
RELU=max{0,x}
将解码器的第三层的激活函数设置为tanh函数,即为:
Figure BDA0002474434560000102
损失算法为Adam算法,将损失函数设置均方误差函数,并且为:
Figure BDA0002474434560000103
其中,n为训练数据集中样本总数,
Figure BDA0002474434560000104
为训练网络的预测输出,yi为真实值,并且为训练模型的训练集原始输入。
(5)对训练模型进行编译,并将训练数据集的数据投喂至训练模型的训练网络中以进行训练。在本实施例中,使用开源人工神经网络库keras中的model.compile函数对训练模型进行编译,而且使用开源人工神经网络库keras中的model.fit函数对训练模型进行训练,将训练数据集投喂到网络中,设置迭代次数,批次数量,以及打开随机选择数据开关。
(6)先在特征提取器中加入训练网络的全连接层,并设置节点个数为钢轨表面病害的类别数,再在训练网络的全连接层后添加归一化指数函数层,并对训练数据集中每个样本的输出得分进行映射,最后将得分最大的样本所对应的类别作为训练网络预测出的类别。在本实施例中,本步骤实现对训练模型的融合,而且将每个样本输出的得分映射到(0,1)区间。其中,每个样本的输出得分的计算公式为:
Figure BDA0002474434560000111
式中,score为输出得分,n为训练数据集中样本总数,i为当前样本的序列。
(7)先将测试数据集的数据输入至训练模型中,再将训练网络的输出结果与预设的人工判断结果相对比,最后根据对比结果计算测试数据集中分类的正确率,并判断正确率是否达到一个预设精度。在正确率达到预设精度时,通过训练模型分类钢轨表面样本图像数据以确定隧道钢轨表面病害。在正确率未达到预设精度时,执行步骤(3)。这里,若能够满足精度要求,则说明模型是有效的;若尚未满足精度要求,由于本模型的重点部分是特征提取器,所以采取的优化策略是重新对特征提取器进行训练,进而使正确率最终满足精度要求。
综上所述,相较于现有的隧道钢轨表面病害检测方法,本实施例的基于非监督特征学习的隧道钢轨表面病害检测方法具有以下优点:
1、该基于非监督特征学习的隧道钢轨表面病害检测方法,其首先检测钢轨表面样本图像并扩充至样本数据集,其次对数据进行预处理并分为训练数据集和测试数据集,而后提取特征并对特征进行重构以训练出特征提取器,随后设定训练参数并建立训练模型,然后对模型进行编译并将训练数据集中数据输入模型训练,再然后通过添加全连接层等对训练模型进行融合,并将得分最大的样本所对应的样本类别作为训练网络预测的类别,最后将测试数据集的数据输入至训练模型中以预测类别,并将预测的类别与人工判断结果进行对比以计算出分类的正确率,通过将正确率与预设精度比较的方式确定训练模型是否有效,是则实现对钢轨表面病害的判别检测,否则重新训练特征提取器,这样最终可以实现隧道钢轨表面病害的检测。在检测的过程中,由于对数据进行划分和训练,当分类正确率达到要求后才会通过模型检测病害,这样可以使检测精度满足各种要求,同时由于检测过程多为数据处理过程,无需人工到现场进行检测和测量,也无需人员对数据进行统计,这样可以带来以下好处:1、由于检测可以自动化实现,检测效率可以大幅提升;2、在对病害检测的过程中不会出现人工测量误差,检测精度得到大幅提高;3、检测所需的人工劳动较少,可以减轻人工劳动强度,检测工作量降低,可以大批量地对铁路隧道进行检测;4、无需人工打标签,可以降低检测成本;5、检测过程中会产生大量的钢轨表面病害图像数据集资源,可以扩充铁路隧道检测数据。
2、该基于非监督特征学习的隧道钢轨表面病害检测方法,其通过自动编码器最小化原始输入和重构输入之间的误差,通过调节编码器使其达到最佳的特征提取性能,这样在误差优化至满足精度要求,网络收敛时,编码器部分已经能够实现特征提取的功能,此时在编码器的输出层之后加上神经网络中常用于分类的全连接层和归一化指数函数层,实现最终的图片精准分类功能。
3、该基于非监督特征学习的隧道钢轨表面病害检测方法,其可以通过同步触发器打开相机及其辅助光源,随着动态检测小车在隧道内的运动,进行钢轨表面样本图像的采集,可以在不同地点、天气、光线等条件下多次重复此步骤,使图像数据集涵盖种类丰富的数据信息,这样可以使训练模型的适应性更强,使检测方法能够检测多种环境的铁路隧道。而且,检测方法对采集到的样本图像进行旋转、缩放、平移、添加噪声等图像处理操作,将图片数量扩充至理想的数据集规模,检测性能更加优越,并提高网络的泛化能力。
4、该基于非监督特征学习的隧道钢轨表面病害检测方法,其在对采样数据预处理时,可以剪去钢轨边缘意外的部分,这样能够有效减小网络计算量,提高训练速度。而且,该检测方法还可以对图像进行灰度处理和中值滤波,这样就能够去除一定的噪声,并且减弱光线等因素的影响,使检测准确性进一步提高。
实施例2
本实施例提供了一种基于非监督特征学习的隧道钢轨表面病害检测方法,该方法在实施例1的基础上增加了以下这些步骤,即步骤(11)和步骤(12)。
(11)将样本数据集以及隧道钢轨表面病害数据上传至一个云平台上。该云平台可以为隧道养护监测平台,其上设置有各段铁路隧道的存储位置,病害信息都会与云平台上的各段铁路隧道相对应,从而生成隧道病害信息的大数据系统。该大数据系统可以积累隧道检测数据,在人员需要查阅时可以通过手机、PC端等设备及时查看,使铁路养护更加便捷化。
(12)对各段铁路隧道钢轨表面的病害量进行统计以获得病害累计量,并进一步判断病害累计量是否超过一个预设病害统计量。在病害累积量达到预设病害统计量时,使云平台向养护人员所具备的养护工具发出告警信息,这样,这样铁路养护人员就可以就是发现并对该段隧道进行处理,使铁路隧道维护更加便捷,提高铁路养护效率和养护质量。
实施例3
本实施例提供了一种基于非监督特征学习的隧道钢轨表面病害检测装置,该装置应用实施例1或实施例2中的基于非监督特征学习的隧道钢轨表面病害检测方法。其中,该隧道钢轨表面病害检测装置可直接设置在现有的铁路隧道养护设备中,例如直接安装在遂检车中。在本实施例中,该隧道钢轨表面病害检测装置包括数据采集模块、预处理模块、特征提取器训练模块、模型建立模块、编译训练模块、类别识别模块以及病害检测模块。
数据采集模块用于采集铁路隧道的多张钢轨表面样本图像,并将多张钢轨表面样本图像扩充至样本数据集。数据采集模块通过相机拍摄钢轨表面样本图像,并且利用遂检车实现在钢轨上移动采集。为了能够保证采集的数据更加全面,得到更好的性能,并提高后续网络的泛化能力,数据采集模块在不同地点、天气、光线条件下重复采集,而且对钢轨表面样本图像进行旋转、缩放、平移以及添加噪声,以扩充样本数据集,使样本数据集中的图像数量大于一定数量。
预处理模块用于对钢轨表面样本图像进行预处理,以将样本数据集划分为训练数据集与测试数据集。其中,预处理模块包括剪裁单元、灰度处理单元、滤波单元以及划分单元。剪裁单元剪去钢轨表面样本图像中钢轨边缘意外的部分,这样能够有效减小网络计算量,提高训练速度。灰度处理单元用于对剪裁单元剪裁后的钢轨表面样本图像进行灰度处理,滤波单元用于对剪裁后的钢轨表面样本图像进行中值滤波,从而去除钢轨表面样本图像中的部分噪声,并且能够减弱光线等因素的影响。
特征提取器训练模块用于先提取训练数据集的数据的特征,再对提取特征进行重构以训练出特征提取器。特征提取器训练模块包括数据输入单元、定义单元、提取单元、重构单元以及误差判定单元。数据输入单元用于按照网络结构的设计,待检测图像经过预处理后,将训练数据集的数据送入输入层。定义单元用于定义编码层和解码层中每个节点的函数表达式。提取单元用于通过编码器的隐藏层提取训练数据集的数据的特征。重构单元用于通过解码器对提取特征进行重构输入。误差判定单元用于最小化原始输入和重构输入之间的误差,来调节编码器使其达到最佳的特征提取性能,并判断误差是否达到一个预设收敛精度。在误差达到预设收敛精度时,误差判定单元将编码器作为特征提取器。这样,网络收敛并达到理想精度后,保存模型中的编码器部分,作为特征提取器,可以满足需求。在误差未达到预设收敛精度时,启动数据输入单元以重新输入数据。
模型建立模块用于设定特征提取器的训练参数,并通过特征提取器建立训练模型。模型建立模块用于实现步骤(4),将所有编码层和解码器前两层激活函数为线性激活函数RELU,将解码器的第三层的激活函数设置为tanh函数,将损失函数设置均方误差函数。
编译训练模块用于对训练模型进行编译,并将训练数据集的数据投喂至训练模型的训练网络中以进行训练。编译训练模块,使用开源人工神经网络库keras中的model.compile函数对训练模型进行编译,而且使用开源人工神经网络库keras中的model.fit函数对训练模型进行训练,将训练数据集投喂到网络中,设置迭代次数,批次数量,以及打开随机选择数据开关。
类别识别模块用于先在特征提取器中加入训练网络的全连接层,并设置节点个数为钢轨表面病害的类别数,再在训练网络的全连接层后添加归一化指数函数层,并对训练数据集中每个样本的输出得分进行映射,最后将得分最大的样本所对应的类别作为训练网络预测出的类别。类别识别模块实现对训练模型的融合,而且将每个样本输出的得分映射到(0,1)区间。
病害检测模块用于先将测试数据集的数据输入至训练模型中,再将训练网络的输出结果与预设的人工判断结果相对比,最后根据对比结果计算测试数据集中分类的正确率,并判断正确率是否达到一个预设精度。在正确率达到预设精度时,通过训练模型分类钢轨表面样本图像数据以确定隧道钢轨表面病害。在正确率未达到预设精度时,驱使特征提取器训练模块工作。
实施例4
本实施例提供了一种铁路隧道检测芯片,该铁路隧道检测芯片内置了计算机程序,该计算机程序能够执行实施例1或2的基于非监督特征学习的隧道钢轨表面病害检测方法。本实施例的隧道检测芯片可以直接内嵌在铁路养护设备之中,也可以单独生产制造,还可制造为检测与测量模块进行应用。
实施例5
本实施例提供了一种计算机终端,其包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序。处理器执行程序时实现实施例1或2的基于非监督特征学习的隧道钢轨表面病害检测方法的步骤。
实施例1或2的方法在应用时,可以软件的形式进行应用,如设计成独立运行的程序,安装在计算机终端上,计算机终端可以是电脑、智能手机、控制系统以及其他物联网设备等。实施例1或2的方法也可以设计成嵌入式运行的程序,安装在计算机终端上,如安装在单片机上。
实施例6
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序。程序被处理器执行时,实现实施例1或2的基于非监督特征学习的隧道钢轨表面病害检测方法的步骤。
实施例1或2的方法在应用时,可以软件的形式进行应用,如设计成计算机可读存储介质可独立运行的程序,计算机可读存储介质可以是U盘,设计成U盾,通过U盘设计成通过外在触发启动整个方法的程序。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于非监督特征学习的隧道钢轨表面病害检测方法,其特征在于,其包括以下步骤:
(1)采集铁路隧道的多张钢轨表面样本图像,并将多张钢轨表面样本图像扩充至样本数据集;
(2)对所述钢轨表面样本图像进行预处理,以将所述样本数据集划分为训练数据集与测试数据集;
(3)先提取所述训练数据集的数据的特征,再对提取特征进行重构以训练出特征提取器;
(4)设定所述特征提取器的训练参数,并通过所述特征提取器建立训练模型;
(5)对所述训练模型进行编译,并将所述训练数据集的数据投喂至所述训练模型的训练网络中以进行训练;
(6)先在所述特征提取器中加入所述训练网络的全连接层,并设置节点个数为钢轨表面病害的类别数,再在所述训练网络的全连接层后添加归一化指数函数层,并对所述训练数据集中每个样本的输出得分进行映射,最后将得分最大的样本所对应的类别作为所述训练网络预测出的类别;
(7)先将所述测试数据集的数据输入至所述训练模型中,再将所述训练网络的输出结果与预设的人工判断结果相对比,最后根据对比结果计算所述测试数据集中分类的正确率,并判断所述正确率是否达到一个预设精度;在所述正确率达到所述预设精度时,通过所述训练模型分类钢轨表面样本图像数据以确定隧道钢轨表面病害;在所述正确率未达到所述预设精度时,执行步骤(3)。
2.如权利要求1所述的基于非监督特征学习的隧道钢轨表面病害检测方法,其特征在于,每个样本的输出得分的计算公式为:
Figure FDA0002474434550000021
式中,score为输出得分,n为所述训练数据集中样本总数,i为当前样本的序列。
3.如权利要求1所述的基于非监督特征学习的隧道钢轨表面病害检测方法,其特征在于,所述钢轨表面样本图像的预处理方法包括:
(2.1)剪去所述钢轨表面样本图像中钢轨边缘意外的部分;
(2.2)对(2.1)剪裁后的钢轨表面样本图像进行灰度处理和中值滤波;
(2.3)将(2.2)处理后的样本数据集划分为训练数据集与测试数据集。
4.如权利要求1所述的基于非监督特征学习的隧道钢轨表面病害检测方法,其特征在于,训练所述特征提取器的方法包括以下步骤:
(3.1)将所述训练数据集的数据送入输入层,所述训练数据集表示为X={x1,x2,x3,L,xn},式中n为训练数据集的样本总数;
(3.2)定义编码层和解码层中每个节点的函数表达式为hi={f(x1),f(x2),f(x3),L,f(xn)},式中f为映射函数,i为当前样本的序列;
(3.3)通过编码器的隐藏层提取所述训练数据集的数据的特征;
(3.4)通过解码器对提取特征进行重构输入
Figure FDA0002474434550000022
(3.5)最小化原始输入和重构输入之间的误差,并判断所述误差是否达到一个预设收敛精度;
在所述误差达到预设收敛精度时,将所述编码器作为所述特征提取器;
在所述误差未达到所述预设收敛精度时,执行步骤(3.1)。
5.如权利要求4所述的基于非监督特征学习的隧道钢轨表面病害检测方法,其特征在于,所述编码器的第一层为全连接层,且设置256个节点,并用于接收所述编码器的输入层的数据;所述编码器的第二层为全连接层,且设置64个节点,并用于接收所述编码器的第一层的输出数据;所述编码器的第三层为全连接层,且设置2个节点,并用于接收所述编码器的第二层的输出数据;所述解码器的第一层为全连接层,且设置64个节点,并用于接收所述解码器的输入层的数据;所述解码器的第二层为全连接层,且设置256个节点,并用于接收所述解码器的第一层的输出数据;所述解码器的第三层为全连接层,且设置128个节点,并用于接收所述解码器的第二层的输出数据。
6.如权利要求4所述的基于非监督特征学习的隧道钢轨表面病害检测方法,其特征在于,在步骤(4)中,
将所述编码器和所述解码器的前两层的激活函数设置为:
RELU=max{0,x}
将所述解码器的第三层的激活函数设置为:
Figure FDA0002474434550000031
将损失函数设置为:
Figure FDA0002474434550000032
其中,n为所述训练数据集中样本总数,
Figure FDA0002474434550000033
为所述训练网络的预测输出,yi为所述训练模型的训练集原始输入。
7.如权利要求1所述的基于非监督特征学习的隧道钢轨表面病害检测方法,其特征在于,在步骤(1)中,通过至少一个动态检测小车在所述铁路隧道内运动以使位于所述动态检测小车上的相机拍摄所述钢轨表面样本图像,并在所述铁路隧道中光线强度未达到预设光强时通过辅助光源增加所述铁路隧道的钢轨表面亮度。
8.如权利要求1所述的基于非监督特征学习的隧道钢轨表面病害检测方法,其特征在于,在不同地点、天气、光线条件下重复进行步骤(1),并对所述钢轨表面样本图像进行旋转、缩放、平移以及添加噪声,以扩充所述样本数据集,使所述样本数据集中的图像数量大于5000张。
9.如权利要求1所述的基于非监督特征学习的隧道钢轨表面病害检测方法,其特征在于,使用开源人工神经网络库keras中的model.compile函数对所述训练模型进行编译,使用model.fit函数对所述训练模型进行训练。
10.一种基于非监督特征学习的隧道钢轨表面病害检测装置,其应用如权利要求1-9中任意一项所述的基于非监督特征学习的隧道钢轨表面病害检测方法,其特征在于,其包括:
数据采集模块,其用于采集铁路隧道的多张钢轨表面样本图像,并将多张钢轨表面样本图像扩充至样本数据集;
预处理模块,其用于对所述钢轨表面样本图像进行预处理,以将所述样本数据集划分为训练数据集与测试数据集;
特征提取器训练模块,其用于先提取所述训练数据集的数据的特征,再对提取特征进行重构以训练出特征提取器;
模型建立模块,其用于设定所述特征提取器的训练参数,并通过所述特征提取器建立训练模型;
编译训练模块,其用于对所述训练模型进行编译,并将所述训练数据集的数据投喂至所述训练模型的训练网络中以进行训练;
类别识别模块,其用于先在所述特征提取器中加入所述训练网络的全连接层,并设置节点个数为钢轨表面病害的类别数,再在所述训练网络的全连接层后添加归一化指数函数层,并对所述训练数据集中每个样本的输出得分进行映射,最后将得分最大的样本所对应的类别作为所述训练网络预测出的类别;以及
病害检测模块,其用于先将所述测试数据集的数据输入至所述训练模型中,再将所述训练网络的输出结果与预设的人工判断结果相对比,最后根据对比结果计算所述测试数据集中分类的正确率,并判断所述正确率是否达到一个预设精度;在所述正确率达到所述预设精度时,通过所述训练模型分类钢轨表面样本图像数据以确定隧道钢轨表面病害;在所述正确率未达到所述预设精度时,驱使所述特征提取器训练模块工作。
CN202010359051.9A 2020-04-29 2020-04-29 基于非监督特征学习的隧道钢轨表面病害检测方法及装置 Active CN111563886B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010359051.9A CN111563886B (zh) 2020-04-29 2020-04-29 基于非监督特征学习的隧道钢轨表面病害检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010359051.9A CN111563886B (zh) 2020-04-29 2020-04-29 基于非监督特征学习的隧道钢轨表面病害检测方法及装置

Publications (2)

Publication Number Publication Date
CN111563886A true CN111563886A (zh) 2020-08-21
CN111563886B CN111563886B (zh) 2023-04-07

Family

ID=72074518

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010359051.9A Active CN111563886B (zh) 2020-04-29 2020-04-29 基于非监督特征学习的隧道钢轨表面病害检测方法及装置

Country Status (1)

Country Link
CN (1) CN111563886B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112330591A (zh) * 2020-09-30 2021-02-05 中国铁道科学研究院集团有限公司 少样本学习的钢轨表面缺陷检测方法及装置
CN113505997A (zh) * 2021-07-13 2021-10-15 同济大学 一种基于机器学习的建筑墙面渗漏水风险等级评估方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709511A (zh) * 2016-12-08 2017-05-24 华中师范大学 基于深度学习的城市轨道交通全景监控视频故障检测方法
WO2019136946A1 (zh) * 2018-01-15 2019-07-18 中山大学 基于深度学习的弱监督显著性物体检测的方法及系统
CN110929610A (zh) * 2019-11-12 2020-03-27 上海五零盛同信息科技有限公司 基于cnn模型和迁移学习的植物病害识别方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709511A (zh) * 2016-12-08 2017-05-24 华中师范大学 基于深度学习的城市轨道交通全景监控视频故障检测方法
WO2019136946A1 (zh) * 2018-01-15 2019-07-18 中山大学 基于深度学习的弱监督显著性物体检测的方法及系统
CN110929610A (zh) * 2019-11-12 2020-03-27 上海五零盛同信息科技有限公司 基于cnn模型和迁移学习的植物病害识别方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杜超等: "改进的VGG网络的二极管玻壳图像缺陷检测", 《图学学报》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112330591A (zh) * 2020-09-30 2021-02-05 中国铁道科学研究院集团有限公司 少样本学习的钢轨表面缺陷检测方法及装置
CN112330591B (zh) * 2020-09-30 2023-01-24 中国国家铁路集团有限公司 少样本学习的钢轨表面缺陷检测方法及装置
CN113505997A (zh) * 2021-07-13 2021-10-15 同济大学 一种基于机器学习的建筑墙面渗漏水风险等级评估方法

Also Published As

Publication number Publication date
CN111563886B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
Zhao et al. Cloud shape classification system based on multi-channel cnn and improved fdm
CN114693615A (zh) 一种基于域适应的深度学习混凝土桥梁裂缝实时检测方法
CN110796186A (zh) 基于改进的YOLOv3网络的干湿垃圾识别分类方法
CN112183313B (zh) 一种基于SlowFast的电力作业现场动作识别方法
CN110569843B (zh) 一种矿井目标智能检测与识别方法
CN108846331B (zh) 一种动车组底盘螺丝紧固件是否脱落的视频识别方法
CN111275198B (zh) 一种轴承异常检测方法及系统
CN111563886B (zh) 基于非监督特征学习的隧道钢轨表面病害检测方法及装置
CN115244548A (zh) 基于人工智能训练深度学习网络的方法及使用其的学习设备
CN111091080A (zh) 人脸识别方法及系统
CN113283282B (zh) 一种基于时域语义特征的弱监督时序动作检测方法
CN111813997A (zh) 入侵分析方法、装置、设备及存储介质
CN106778650A (zh) 基于多类型信息融合的场景自适应行人检测方法和系统
Liu et al. An efficient method for high-speed railway dropper fault detection based on depthwise separable convolution
CN110458022B (zh) 一种基于域适应的可自主学习目标检测方法
CN116166983A (zh) 一种基于机器学习的列车弓网故障检测方法
CN115294033A (zh) 一种基于语义分割网络的轮胎带束层差级和错边缺陷检测方法
CN117237590B (zh) 基于图像识别的光伏组件热斑识别方法及系统
CN108563997B (zh) 一种建立人脸检测模型、人脸识别的方法和装置
CN105404682A (zh) 一种基于数字图像内容的图书检索方法
CN116434258A (zh) 一种表格数据的自动识别方法
CN116630809A (zh) 基于智能图像分析的地质雷达数据自动识别方法及系统
CN110555384A (zh) 基于图像数据的牛肉大理石纹自动分级系统及方法
CN114742850A (zh) 基于ugnx模型分析的电极形体自动识别的实现方法
CN112395956A (zh) 一种面向复杂环境的可通行区域检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant