CN109934335A

CN109934335A - 基于混合深度学习的高铁道岔故障诊断方法

Info

Publication number: CN109934335A
Application number: CN201910164985.4A
Authority: CN
Inventors: 张国华; 董炜; 章彭; 孙新亚; 闫友为; 燕翔; 蒋灵明; 吉吟东
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2019-03-05
Filing date: 2019-03-05
Publication date: 2019-06-25

Abstract

本发明提供一种基于混合深度学习的高铁道岔故障诊断方法，该方法在详细分析了VGG‑Net结构与SVM原理之后，通过利用VGG‑Net使用多个较小卷积核的卷积层代替一个较大卷积核的卷积层的思想与支持向量机在处理小数据方面具有良好分类性能的优势，设计提出了基于DCNN‑SVM混合模型的高铁道岔智能故障诊断方法，本申请提供的诊断方法诊断准确率达到100％，远比传统单一的机器学习方法及现有技术采用的基于卷积神经网络的算法效果好，表明了通过混合深度学习思想将神经网络与机器学习算法混合在一起，所构建的新的混合模型，在实际应用中拥有着非常好的效果。

Description

基于混合深度学习的高铁道岔故障诊断方法

技术领域

本发明属于道岔故障诊断领域，特别涉及一种基于混合深度学习的高铁道岔故障诊断方法。

背景技术

中国高铁经过十多年的高速发展，截止到2017年底，总里程已超过2.5万公里，跃居世界第一位，现已成为人们中长途出行首选的交通工具。随着高铁运行里程和运行速度的不断提升，其安全问题也备受关注。高铁信号设备工作状态的好坏将直接决定高铁运行的安全性，确保信号设备的安全可靠运行对促进高铁的快速发展与高效安全运行有着重要意义。道岔作为一种关键的高铁信号设备，其主要作用是切换列车的前进方向以实现列车的转线和跨线运行。由于我国目前高铁发展迅速，所需的道岔数量也将十分庞大。列车行车密度高将导致道岔的转换频繁，长时间的运行会产生磨损、老化。道岔作为一种室外装置，容易受到外部环境的影响，温度、湿度等气候变化都可能影响道岔的安全运行。上述情况极易导致道岔出现故障，将会对高铁的安全可靠运营产生重大隐患。

传统的道岔故障诊断主要依赖于人工经验，铁路工作人员通过定期浏览微机监测采集到的道岔运行数据，将所监测到的动作电流、功率等曲线，与正常运行的道岔监测数据进行对比，从而确定其运行工作状态是否存在异常。目前这种人工故障诊断方法不但需要花费大量的人力物力，且效率低下，还会存在误判和漏判等状况，更严重依赖专家经验知识。因此，为了提高道岔维护效率，消除事故隐患，进而保证高铁的高效安全运行，需设计并实现高度智能化的道岔故障诊断方法。

随着高铁技术的不断发展，国内外学者已经对高铁道岔的故障诊断方法做了大量的研究工作，主要集中在维护人员通过对监测到的道岔电流电压功率曲线等数据进行人工处理分析从而进行故障诊断。目前主要的故障诊断方法大致可分为三类：基于专家系统的故障诊断方法、基于解析模型的故障诊断方法以及基于传统机器学习的故障诊断方法。

基于专家系统的故障诊断方法是根据在某一领域的专家经验建立知识库，通过计算机程序模拟专家的推理思维过程，依据经验知识做出判断和决策从而进行故障诊断的方法。

目前，不少研究人员对专家系统在高铁道岔故障诊断领域进行了深入的研究。王军研究了基于故障树的专家系统故障诊断方法，通过设计高铁道岔智能监测系统能够对道岔设备状态进行实时监测并做出故障诊断。黄毅等针对西门子S700K型电动道岔的常见故障模式进行了分析与处理，详细说明了道岔动作电流曲线、功率曲线与道岔运行状况的关系，并比较了正常情况与故障模式之间各个曲线的峰值、时间长度、标准差等各种参数的不同，然后将这些专家经验知识存储到计算机中作为规则库，实现了对道岔各种故障模式的有效识别诊断。北京交通大学的薛艳青在其硕士论文中采用基于专家系统的故障诊断方法，通过计算机模拟人类专家的推理决策过程，对道岔的故障运行状态进行判断和分析进而实现对道岔的故障诊断。清华大学的周芬芳以道岔动作电流曲线为研究对象，通过采用基于专家系统的方法提炼出道岔故障诊断规则，建立专家经验知识库，实现了道岔动作电流曲线的在线故障诊断。

基于解析模型的故障诊断方法不依赖于专家经验知识，而是通过对诊断对象进行仿真建模、实物复现等方法来进行故障诊断，其关键技术在于如何对诊断对象建立精准的数学模型并根据模型相关参数变化来分析处理故障。

基于解析模型的道岔故障诊断方法受到了很多研究者的关注。Calado等设计了一种基于定性模型的道岔故障诊断方法，将采集的运行参数的变化输入给模型，并将模型估计输出和实际输出之差输入给训练好的神经网络来实现故障诊断。Omer F等建立了一种基于状态的铁路道岔数学模型，通过采用基于时延神经网络的道岔故障预测系统实现了对道岔的运行状态进行预测。Elena Z则通过检测系统对电压电流采样处理，将道岔的运行过程视为一个线性时不变(Linear Time Invariant，LTI)模型，并通过数学方法进行建模，结合H2范数的诊断方法设计实现道岔故障预警。Puig则提出了一种具有鲁棒性故障检测和隔离的故障诊断方法，使用区间观测器模型设计了道岔故障诊断模型，根据所提出的指标进行实验得到了良好的结果。

机器学习是人工智能的核心研究领域之一，是研究计算机如何模拟或实现人类的学习行为以获取新的知识或技能，进而重新组织已有的知识结构使之不断改善自身行为的一种技术。基于传统机器学习的故障诊断方法主要依靠对运行数据进行处理分析，在没有精确的数学解析模型的情况下进行故障诊断，属于一种数据驱动的诊断方法。

近年来，运用机器学习的方法对道岔进行故障诊断的研究得到了学者的广泛关注。Fausto等提出了一种基于自适应模糊神经网络的道岔故障诊断方法，以道岔信号参数为研究对象，通过主成分分析的方法降低数据的复杂度，实现了道岔故障的检测和识别。王铁军在分析各种典型道岔故障机理基础之上，通过构造反向传播(Back Propagation，BP)神经网络模型与径向基(Radial Basis Function，RBF)神经网络模型分别对道岔进行了智能故障诊断，该方法能快速、有效地诊断出故障原因，为维修人员提供技术支持。王文博基于道岔控制电路的工作原理，提出了一种基于BP神经网络的道岔故障诊断算法，并通过现场数据证实该算法在诊断精度与效果方面具有良好的表现。张凯在分析某型号高铁道岔的典型动作电流曲线的基础之上，通过建立概率神经网络(Probabilistic NeuralNetworks，PNN)对道岔控制电路进行故障智能诊断，并通过离线测试验证了算法的有效性。北京交通大学的何攸旻提出了一种基于支持向量机(Support Vector Machine，SVM)的高铁道岔故障诊断方法，利用道岔动作电流曲线数据训练SVM经验模型然后进行故障诊断，该方法已取得了良好的现场诊断效果。关琼则利用果蝇算法(Fruit Fly OptimizationAlgorithm，FOA)优化支持向量机的训练参数,提出基于FOA-LSSVM的道岔故障诊断算法来提高道岔故障诊断的准确率。杨静则从定量的角度研究了道岔的故障诊断方法，通过采用离散小波变换(Discrete Wavelet Transform，DWT)对故障进行特征提取，并利用非线性SVM方法对特征信息进行故障识别，实现了对道岔的故障诊断。

随着人工智能的发展，将深度学习的方法应用于解决复杂工业系统的故障诊断研究已初现端倪。深度学习(Deep Learning)作为机器学习的一个新兴技术，其动机在于建立模拟人脑进行分析学习的神经网络，通过对数据进行分层特征表示，实现将低级特征进一步抽象成高级特征表示。2006年，Hinton于《Science》子刊上首次提出了深度学习的概念。2015年，Hinton、LeCun和Bengio三位深度学习巨头在《Nature》期刊上介绍了深度学习在语音识别、目标检测以及其他领域的应用，并深入浅出地介绍了卷积神经网络(Convolutional Neural Network，CNN)、循环神经网络等几种典型深度学习模型的基本原理和应用前景。

近年来，将深度学习中卷积神经网络模型应用于解决复杂系统的故障诊断研究已取得了不少成果。任浩等详细介绍了CNN在故障诊断领域中的研究现状，并指出由于CNN能学习海量数据中的特征以及识别海量数据中蕴含的信息，于是非常适合处理海量数据。华中科技大学的高亮及其团队采用了一种基于LeNet-5的卷积神经网络对滚动轴承进行了故障诊断的研究，通过将信号转换为二维图像的方法，提取转换后二维图像的特征，消除了人工特征提取的影响，并通过在三个常见标准数据集上的实验来验证了该故障诊断方法的有效性。Hoang DT等提出了一种基于卷积神经网络的轴承故障诊断方法，通过将一维的振动信号转换为二维的振动图像用于轴承故障分类，并通过与其他方法在轴承故障数据库进行诊断比较，验证了该算法的有效性。Jing L等将卷积神经网络用于变速箱的状态监测中，通过与时域、频域、小波域等三种常用的人工特征提取方法进行实验比较，表明采用基于CNN的方法可以直接从振动信号的频率数据中提取特征，并且诊断精度高于其它对比方法。LeeK B针对半导体制造过程中的故障检测和分类问题，提出了一种具有自动特征提取和故障诊断功能的CNN模型，并通过实验表明该模型能较好的适应半导体制造过程中多变量信号的复杂环境。魏东等则在分析卷积神经网络的结构及原理基础之上，提出了一种基于卷积神经网络对输电线路区内外故障判断及故障选相方法，用同一CNN网络实现了对上述两类非独立分类问题的权值共享。吉珊珊等则通过卷积神经网络对液压缸压力信号的学习与训练,使其在不确定工况下通过输入压力信号自动地检测液压缸的泄漏程度，该方法具有较高的可靠性。

随着深度学习的不断研究与发展，目前又提出了混合深度学习这一研究思想。混合深度学习是将不同的神经网络与机器学习算法融合在一起，构建一种新的模型结构，在性能提升和广泛应用方面展现了巨大的潜力。Zhicheng Wang等人通过改造CNN网络结构，结合极限学习机(Extreme Learning Machine，ELM)模型，提出了CNN-ELM的方法，同时解决了年龄和性别两个分类问题。同济大学CAD研究中心与Agarap等人则都提出采用一种基于CNN-SVM的模型对图像进行检测分类，通过利用CNN自动提取图片特征与SVM优越的分类性能优势，并与单独的CNN或者SVM模型对比证明其模型的优越性。Li NX等则针对卷积神经网络与递归神经网络RNN两种不同的神经网络模型的特点进行了混合研究，提出了基于CNN-RNN的混合深度学习模型，并在相关的领域进行了研究应用。

国内外目前对于道岔的故障诊断研究方法各有优劣。采用基于专家系统的微机监测方法不需要对系统进行数学建模并且在诊断表达上易于理解、方便修改，但专家经验知识往往受到人工经验水平的限制并且与道岔特定的工作环境密切相关，对不同运行环境下的道岔进行故障诊断系统适应性差。基于解析模型的故障诊断方法不需要大量的样本数据和专家经验知识，诊断效果好，但其诊断的性能往往受到数学模型的精确度影响，在实际研究中很难对建模对象建立一个精确的数学模型。尤其对于像道岔这样复杂的设备而言，建立精确的道岔数学模型本身就是一件很困难的事情。

目前对于道岔的故障诊断技术主要采用基于传统机器学习的方法,其所建立的故障诊断模型相比基于专家系统与解析模型的方法具有更强的适应性，且具备了一定的学习能力。传统机器学习方法只有在大量故障样本的情况下才能获得较好的诊断效果，但实际情况下道岔的故障样本往往很少，且在特征提取方面往往依赖专家经验，从而影响其诊断效果。

发明内容

为了解决现有技术中存在的问题，本发明提供了一种基于混合深度学习的高铁道岔故障诊断方法。

本发明具体技术方案如下：

本发明提供一种基于混合深度学习的高铁道岔故障诊断方法，该方法包括如下步骤：

S1：获取道岔动作电流曲线数据，并进行预处理和归一化处理；

S2：将经过归一化处理的数据转换为二维矩阵；

S3：利用深度卷积神经网络-支持向量机混合模型对步骤S2获得的二维矩阵进行特征向量提取；

S4：利用提取的特征向量对深度卷积神经网络-支持向量机(DCNN-SVM)混合模型进行训练，构建道岔故障诊断模型，将待检测数据输入到道岔故障诊断模型中，根据输出结果判断待检测数据是否为故障数据。

进一步的改进，步骤S1所述的预处理为将采样点维度进行统一。

进一步的改进，步骤S1所述的归一化处理为对道岔实际运行数据进行Min-Max标准化归一化到(0，1)之间。

进一步的改进，所述深度卷积神经网络-支持向量机混合模型包括十层神经网络。

进一步的改进，所述十层神经网络包括输入层、卷积层、卷积层、池化层、卷积层、卷积层、卷积层、池化层、全连接层和输出层。

进一步的改进，所述全连接层使用的核函数为Linear。

本发明的有益效果：

本发明提供一种基于混合深度学习的高铁道岔故障诊断方法，该方法在详细分析了深度卷积神经网络(VGG-Net)结构与SVM原理之后，通过利用VGG-Net使用多个较小卷积核的卷积层代替一个较大卷积核的卷积层的思想与支持向量机在处理小数据方面具有良好分类性能的优势，设计提出了基于DCNN-SVM混合模型的高铁道岔故障诊断方法，本申请提供的诊断方法诊断准确率达到100％，远比传统单一的机器学习方法及现有技术采用的基于CNN的算法效果好，表明了通过混合深度学习思想将神经网络与机器学习算法混合在一起，所构建的新的混合模型，在实际应用中拥有着非常好的效果。

附图说明

图1为实施例1一种基于混合深度学习的高铁道岔故障诊断方法的流程图；

图2为九种归一化处理后的数据，图中，a表示正常，b至i分别表示故障1至故障8；

图3为一维数据转换为二维矩阵原理图；

图4为VGG-19模型结构；

图5为简单二分类模型；

图6为非线性可分模型；

图7为DCNN-SVM混合模型图；

图8为全连接层神经元数量为16时提取的特征向量形态图，图中，a表示正常，b至i分别表示故障1至故障8；

图9为全连接层神经元数量为32时提取的特征向量形态图，图中，a表示正常，b至i分别表示故障1至故障8；

图10为全连接层神经元数量为64时提取的特征向量形态图，图中，a表示正常，b至i分别表示故障1至故障8；

图11为全连接层神经元数量为128时提取的特征向量形态图，图中，a表示正常，b至i分别表示故障1至故障8；

图12为全连接层神经元数量为256时提取的特征向量形态图，图中，a表示正常，b至i分别表示故障1至故障8。

附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所描述的步骤。

具体实施方式

由于本发明的方法描述是在计算机系统中实现的，该计算机系统可以设置在服务器或客户端的处理器中。例如本文所述的方法可以实现为能以控制逻辑来执行的软件，其由服务器中的CPU来执行。本文所述的功能可以实现为存储在非暂时性有形计算机可读介质中的程序指令集合。当以这种方式实现时，该计算机程序包括一组指令，当该组指令由计算机运行时其促使计算机执行能实施上述功能的方法。可编程逻辑可以暂时或永久地安装在非暂时性有形计算机可读介质中，例如只读存储器芯片、计算机存储器、磁盘或其他存储介质。除了以软件来实现之外，本文所述的逻辑可以利用分立部件、集成电路、与可编程逻辑设备(诸如，现场可编程门阵列(FPGA)或微处理器)结合使用的可编程逻辑，或者包括它们任意组合的任何其他设备来体现。所有此类实施均落入本发明的范围之内。

实施例1

本发明实施例1提供一种基于混合深度学习的高铁道岔故障诊断方法，如图1所示，该方法包括如下步骤：

步骤S1中，道岔的正常动作过程一般分为：解锁-转换-锁闭三个时段，根据每个时段动作的不同形成了相应的道岔动作电流曲线。

步骤S1中，所述预处理为将数据的采样点长度(维度)统一到169(13×13)维；为了加快训练速度，需要对预处理的数据进行归一化处理，归一化处理为对道岔实际运行数据进行Min-Max标准化归一化到(0，1)之间。

Min-Max标准化也称为离差标准化，是对原始数据的线性变换，使结果值映射到[min,max]之间。转换函数如式(1)所示：

其中，x为原始数据，x^*为归一化后数据，max为原始样本中每条数据的最大值，min为原始样本中每条数据的最小值。

归一化后的九种数据如图2所示。

S2：将经过归一化处理的数据转换为二维矩阵；

步骤S2中，为了更好的处理运用卷积神经网络，将归一化处理的一维电流曲线数据转换为二维矩阵，变换原理如图3所示，将原来的一维动作电流曲线数据(1×169)变换为二维矩阵(13×13)，然后将所得到的二维矩阵作为深度卷积神经网络的数据输入。

S3：利用深度卷积神经网络-支持向量机混合模型对步骤S2获得的二维矩阵进行特征向量提取。

步骤S3中，VGG-Net是由牛津大学的视觉几何组(Visual Geometry Group，VGG)研发提出的一种新的深度卷积神经网络。VGG-Net探索了卷积神经网络的深度与其性能之间的关系，成功地构筑了16～19层深的卷积神经网络，证明了通过增加神经网络的深度能够在一定程度上影响网络最终的性能，使分类错误率大幅下降。经典的卷积神经网络的结构通常为：输入层→卷积层→池化层→全连接层→输出层，而VGG-Net在卷积层部位增加了多个卷积层，图4为VGG-19模型的结构示意图，VGG-19模型的工作原理如下：

(1)输入224×224×3的图片，经64个3×3的卷积核作两次卷积并采用ReLU激活函数，卷积后的特征图尺寸变为224×224×64，接着作Max pooling(最大池化)，池化核为2×2，池化后的特征图尺寸变为112×112×64。

(2)通过128个3×3的卷积核作两次卷积并采用ReLU激活函数，特征图尺寸变为112×112×128，然后作2×2的Max pooling池化，特征图尺寸变为56×56×128。

(3)通过256个3×3的卷积核作三次卷积并采用ReLU激活函数，特征图尺寸变为56×56×256，然后作2×2的Max pooling池化，特征图尺寸变为28×28×256。

(4)通过512个3×3的卷积核作三次卷积并采用ReLU激活函数，特征图尺寸变为28×28×512，然后作2×2的Max pooling池化，特征图尺寸变为14×14×512。

(5)通过512个3×3的卷积核作三次卷积并采用ReLU激活函数，特征图尺寸变为14×14×512，然后作2×2的Max pooling池化，特征图尺寸变为7×7×512。

(6)与两层1×1×4096，一层1×1×1000进行全连接与ReLU，输出特征向量，通过Softmax分类器输出1000个预测结果。

步骤S3中，本申请中DCNN-SVM混合模型包括十层，第一层为输入层，其数据大小为13×13；第二层和第三层为卷积层，卷积核的大小都为3×3，数量为8，步长为1；第四层为池化层，采用最大池化方式，核大小为2×2，步长为2；第五六七层为卷积层，第八层为池化层，参数设置同上几层；第九层为全连接层，其神经元数量可变；第十层为输出层，采用SVM分类器。本申请的DCNN-SVM混合模型如图7所示。

SVM分类器是一种二分类模型。支持向量机可以分为线性和非线性两大类，它的目的是寻找一个超平面来对样本进行分割，分割的原则是间隔最大化，并最终转化为一个凸二次规划问题来求解，针对小样本数据也有着良好的分类性能。其由简至繁的模型包括：线性可分支持向量机、线性不可分支持向量机、非线性可分支持向量机。

1)线性可分支持向量机

如果一个线性函数能够将样本分开，则称这些数据样本是线性可分的。线性函数，在二维空间中的表示就是一条直线，在三维空间中可以表示为一个平面，以此类推，在不考虑空间维数的情况下，这样的线性函数统称为超平面。如图5所示，其是一个二维空间的例子，实心圆代表正类，空心圆代表负类，样本是线性可分的，但是很显然不只有这一条直线可以将样本分开，而是有无数条，我们所说的线性可分支持向量机就对应着能将数据正确划分并且使间隔最大的直线。

首先计算间隔，间隔就等于两个异类支持向量的差在w上的投影，如式(2)所示：

其中和分别表示两个正负支持向量，和满足y_i(w^Tx_i+b)＝1，如式(3)所示：

推出式(4)：

代入式(2)中可以得到式(5)：

至此，求得了间隔，SVM的思想是使得间隔最大化，如式(6)所示：

显然，最大化相当于使‖w‖的结果最小化，将式(6)转化成如式(7)所示：

式(7)即为最基本的支持向量机模型，其本身是一个凸二次规划问题，对式(7)使用拉格朗日乘子法得到其对偶问题，其拉格朗日函数可以写成式(8)所示：

对式(8)中的w,b分别求偏导并令其偏导值等于0，如式(9)所示：

将式(8)代入式(9)，可得式(10)：

此时，原问题就转化为式(11)所示的关于α的问题：

解出α之后，根据式(10)可以求得w，进而求得b，可以得到式(12)所示的模型：

2)线性不可分支持向量机和核函数

线性可分支持向量机并不能有效解决非线性问题，要使用非线性模型才能很好地对非线性问题进行分类。如图6所示，使用一条直线很显然并不能将两类样本分开，但是可以使用一条椭圆曲线(非线性模型)将它们分开，非线性问题往往不好求解，所以希望能用解线性分类问题的方法求解，因此可以采用非线性变换，将非线性问题变换成线性问题。

对于非线性问题，可以将训练样本从原始空间映射到一个更高维的空间，使得样本在这个空间中线性可分，如果原始空间的维数是有限的，即属性是有限的，那么一定存在一个高维特征空间是样本可分。令φ(x)表示将x映射后的特征向量，于是在特征空间中，划分超平面所对应的模型可表示为式(13)所示：

f(x)＝w^Tφ(x)+b (13)

于是有式(14)所示的最小化函数：

其对偶问题如式(15)所示：

若要对式(15)求解，会涉及到计算φ(x_i)^Tφ(x_j)，这是样本x_i和x_j映射到特征空间之后的内积，由于特征空间的维数可能很高，甚至是无穷维，因此直接计算φ(x_i)^Tφ(x_j)通常是困难的，于是想到式(16)所示的函数：

κ(x_i,x_j)≤φ(x_i),φ(x_j)≥φ(x_i)^Tφ(x_j) (16)

即x_i和x_j在特征空间中的内积等于它们在原始样本空间中通过函数κ(x_i,x_j)计算的函数值，于是式(17)写成如下：

求解后得到式(18)所示：

这里的函数κ(x_i,x_j)就是核函数，常见的核函数主要有以下四种:

(1)线性(Linear)核函数：κ(x_i,x_j)＝x_i·x_j

(2)多项式(Poly)核函数：κ(x_i,x_j)＝[γ(x_i·x_j)+c]^α

(3)RBF核函数：κ(x_i,x_j)＝exp(-γ|x_i-x_j|²)

(4)Sigmoid型核函数：κ(x_i,x_j)＝tanh(γ(x_i·x_j)+c)。

3)非线性可分支持向量机与松弛变量

线性不可分意味着某些样本点(x_i,x_j)不能满足间隔大于等于1的条件，样本点落在超平面与边界之间。为解决这一问题，可以对每个样本点引入一个松弛变量ξ_i≥0，使得间隔加上松弛变量大于等于1，这样约束条件如式(19)所示：

y_i(w^Tx_i+b)≥1-ξ_i (19)

同时，对于每一个松弛变量ξ_i≥0，目标函数如式(20)所示:

其中C>0为惩罚参数，C值大时对误分类的惩罚增大，C值小时对误分类的惩罚减小，式(20)包含两层含义：使尽量小即间隔尽量大，同时使误分类点的个数尽量小，C是调和两者的系数。

有了式(20)，可以和线性可分支持向量机一样考虑线性支持向量机的学习过程，此时，线性支持向量机的学习问题变成如下凸二次规划问题的求解，如式(21)所示：

与线性可分支持向量机的对偶问题解法一致，式(21)的拉格朗日函数如式(22)所示：

令L(w,b,α,ξ,μ)对w,b,ξ的偏导数为零可得式(23)：

将式(23)代入式(22)得对偶问题，如式(24)所示：

解出α之后，根据式(10)可以求得w，进而求得b，可以得到式(25)所示的模型：

步骤S3中，为了降低混合模型的过拟合程度，在全连接层采用了Dropout方法，设置Dropout数值为0.6。

S4：利用提取的特征向量对深度卷积神经网络-支持向量机混合模型进行训练，构建道岔故障诊断模型，将待检测数据输入到道岔故障诊断模型中，根据输出结果判断待检测数据是否为故障数据。

步骤S4中，全连接层使用的核函数为Linear。

本申请提供的基于混合深度学习的高铁道岔故障诊断方法，基于DCNN-SVM混合模型的高铁道岔故障诊断方法，其诊断准确率达到100％，远比传统单一的机器学习方法及现有技术采用的基于CNN的算法效果好，表明了通过混合深度学习思想将神经网络与机器学习算法混合在一起，所构建的新的混合模型，在实际应用中拥有着非常好的效果。

实验例1核函数选择的考察

在DCNN-SVM混合模型中，全连接层的作用主要为将经过多次卷积后高度抽象化的非线性特征进行整合学习，为了对比不同全连接层神经元数量时测试集的准确率，对此提取了全连接层神经元数量为16、32、64、128、256时九种数据的一维特征向量形态，如图8至图12所示。

SVM算法选择使用Python中Sklearn库的SVM函数，相关参数设置选择其默认参数(其中惩罚参数C＝1，γ＝auto＝1/9，常数项c＝0)，Linear、RBF、Poly、Sigmoid为SVM中所使用的不同核函数。针对DCNN-SVM算法模型中其核函数不同，以及在DCNN全连接层中提取的一维特征向量是否直接输入SVM还是归一化后再进行SVM分类共进行了八组实验，其中，DCNN-16-SVM中的数字16表示为深度卷积神经网络中全连接层的神经元数量为16，其它数据表示方法相同。

提取全连接层中的特征向量(未归一化)输入SVM中进行分类实验结果，如表1-4所示。

表1核函数为Linear的测试集准确率(％)

表2核函数为RBF的测试集准确率(％)

表3核函数为Poly的测试集准确率(％)

表4核函数为Sigmoid的测试集准确率(％)

提取全连接层中的特征向量(归一化)输入SVM分类实验结果如表5-8所示。

表5核函数为Linear的测试集准确率(％)

表6核函数为RBF的测试集准确率(％)

表7核函数为Poly的测试集准确率(％)

表8核函数为Sigmoid的测试集准确率(％)

在相关默认参数下，表1-8展示了在特征向量是否归一化时使用不同核函数的实验结果，实验结果的数据差异化很明显，本实验的测试集数据总量为90条，一条数据分类错误就会导致准确率下降1.11％，从而导致五折交叉实验结果中的标准差数据值较大。

在不同全连接层神经元数量且使用不同核函数时的DCNN-SVM混合模型的分类结果平均准确率，如表9所示。

表9不同全连接层神经元不同核函数时的DCNN-SVM的分类平均准确率(％)

从表中可以得出，在默认相关参数设置而未进行参数寻优的情况下，在不讨论从全连接层提取的一维向量是否归一化，核函数为Linear、RBF的准确率相比于Poly、Sigmoid好，而且随着全连接层神经数量的增加，分类的平均准确率不断提高。Poly、Sigmoid核函数在数据是否归一化的情况下所得到的分类结果差别非常大，而Linear核函数在默认参数的情况下无论是否归一化其结果都非常的稳定，且当全连接层神经元数量为64及以上时的分类准确率达到了100％，这充分说明了DCNN-SVM混合模型在全连接层神经元达到一定数量时，深度卷积神经网络可以充分的自动提取数据的特征，选择合适的核函数后SVM算法可以有效的对小数据进行分类，两者相混合可以产生非常好的效果。

实验例2与其他方法进行比较

为了验证所提出的基于DCNN-SVM混合模型的故障诊断方法的优越表现性能，将该方法与现有方法进行对比，所采用的数据均为未添加噪声的原始450(50×9)条数据，且均采用了五折交叉验证的方法，对比结果如表10所示。

表10不同方法结果对比(％)

从表中可以看出，采用基于DCNN-SVM混合模型的方法可以达到100％准确率对道岔数据进行分类，表明本文所提供的基于混合深度学习的高铁道岔故障诊断方法具有优越性能。

Claims

1.一种基于混合深度学习的高铁道岔故障诊断方法，其特征在于，所述方法包括如下步骤：

S2：将经过归一化处理的数据转换为二维矩阵；

S4：利用提取的特征向量输入深度卷积神经网络-支持向量机混合模型进行训练，构建道岔故障诊断模型，将待检测数据输入到道岔故障诊断模型中，根据输出结果判断待检测数据是否为故障数据。

2.如权利要求1所述的基于混合深度学习的高铁道岔故障诊断方法，其特征在于，步骤S1所述的预处理为将采样点维度进行统一。

3.如权利要求1所述的基于混合深度学习的高铁道岔故障诊断方法，其特征在于，步骤S1所述的归一化处理为对道岔实际运行数据进行Min-Max标准化归一化到(0，1)之间。

4.如权利要求1所述的基于混合深度学习的高铁道岔故障诊断方法，其特征在于，所述深度卷积神经网络-支持向量机混合模型包括十层神经网络。

5.如权利要求4所述的基于混合深度学习的高铁道岔故障诊断方法，其特征在于，所述十层神经网络包括输入层、卷积层、卷积层、池化层、卷积层、卷积层、卷积层、池化层、全连接层和输出层。

6.如权利要求5所述的基于混合深度学习的高铁道岔故障诊断方法，其特征在于，所述全连接层使用的核函数为Linear。