CN117313251A

CN117313251A - 基于非滞后渐进学习的列车传动装置全局故障诊断方法

Info

Publication number: CN117313251A
Application number: CN202311621104.XA
Authority: CN
Inventors: 王彪; 邱海权; 秦勇; 贾利民; 丁奥; 郭亮
Original assignee: Beijing Jiaotong University
Current assignee: Beijing Jiaotong University
Priority date: 2023-11-30
Filing date: 2023-11-30
Publication date: 2023-12-29
Anticipated expiration: 2043-11-30
Also published as: CN117313251B

Abstract

本发明涉及列车运行安全保障技术领域，具体涉及一种基于非滞后渐进学习的列车传动装置全局故障诊断方法，包括：在基础学习阶段，构建全局诊断模型，并获取数据集；构建列车传动装置各部件之间的空间关系图，通过掩码方式将空间关系图中各节点信息进行结合；对全局诊断模型进行初步训练；在进阶学习阶段，从上一阶段数据集中选取部分样本，与新数据集组合为进阶学习阶段的数据集；将上一阶段学习到的健康信息衔接至当前学习阶段，构造当前阶段的非滞后损失函数，对全局诊断模型进行再次训练，直至模型收敛，进入下一进阶学习阶段。本发明能够对整个列车传动装置进行全局诊断，同时缓解了渐进学习过程中，模型在新故障样本不足情况下的过拟合。

Description

基于非滞后渐进学习的列车传动装置全局故障诊断方法

技术领域

本发明涉及列车安全运行保障技术领域，更具体的说是涉及一种基于非滞后渐进学习的列车传动装置全局故障诊断方法。

背景技术

列车走行部传动装置由电机、齿轮箱、轴箱、轮对等部分组成，用于传递列车运行的牵引力，是保障列车运行品质、行车安全的关键部件。列车传动装置因受到来自车体和轨道的荷载和冲击，发生故障失效的概率不断增加，这直接威胁着列车运行安全。近年来，众多研究人员聚焦于列车传动装置关键部件的故障诊断方法研究，并使用基于深度学习的智能故障诊断方法实现了优异的诊断效果。但是，目前的故障诊断方法只是针对于局部某个关键部件的诊断，难以实现对整个传动系统进行全局的诊断，若使用传统深度学习方法对各个关键部件建立单独的诊断网络，不仅会给网络的训练和管理带来繁重的工作，而且没有考虑到故障在系统中的传播以及各部件之间耦合关系的影响。此外，不少研究人员也将渐进学习技术引入故障诊断中，当模型面对动态增加的数据集时，能够在保持既有诊断能力的同时，拓展可诊断故障类型范围。然而在实际应用中，获得足够的新故障样本需要长时间积累，这会导致渐进学习模型出现严重的滞后性。若使用有限样本对模型进行训练，容易出现模型的过拟合、泛化性能不好的问题，这限制了智能诊断模型在实际工程场景下的应用潜力。

发明内容

有鉴于此，本发明提供了一种基于非滞后渐进学习的列车传动装置全局故障诊断方法，能够对整个列车传动装置进行全局诊断，同时缓解了渐进学习过程中，模型在新故障样本不足情况下的过拟合。

为了实现上述目的，本发明采用如下技术方案：

一种基于非滞后渐进学习的列车传动装置全局故障诊断方法，包括：一个基础学习阶段和多个进阶学习阶段；

在基础学习阶段，构建全局诊断模型，并获取数据集；

构建列车传动装置各部件之间的空间关系图，通过掩码方式将空间关系图中各节点信息进行结合，计算各节点的全局特征矩阵；

计算基础学习阶段的标准样本信息矩阵；

基于标准样本信息矩阵和各节点的全局特征矩阵构造基础学习阶段的损失函数，利用基础学习阶段的数据集对全局诊断模型进行初步训练，直至模型收敛，进入进阶学习阶段；

在进阶学习阶段，获取上一学习阶段未出现的数据集，并从上一学习阶段的数据集中随机选取一部分作为参考样本，将两者组合作为进阶学习阶段的数据集；

将上一学习阶段的标准样本信息矩阵衔接至当前学习阶段，构造当前学习阶段的非滞后损失函数，利用当前学习阶段的数据集对上一学习阶段训练好的全局诊断模型进行再次训练，直至模型收敛，进入下一进阶学习阶段，直至满足训练目标。

进一步的，各部件之间的空间关系图的构建过程包括：

根据列车传动装置各个部件的连接结构，将关键部件视为节点，将部件之间的空间邻接关系视为边，构建部件空间关系图，其中，V为节点集，E为边集。

进一步的，各节点的全局特征矩阵的计算过程包括：

基于特征提取器提取各节点的特征矩阵；

将每个节点的特征矩阵输入到空间关系图中，引入全局卷积网络，为每个节点分配独立的卷积核以融合节点属性，并采用掩码方式实现空间关系图中各节点间的信息传递，对列车传动装置各部件的相互作用进行建模和解耦，得到各节点的全局特征矩阵。

进一步的，掩码方式包括：

将卷积核的初始大小设置为与节点总数相同，根据掩码将非相邻节点排除在卷积计算之外，掩码矩阵通过下式计算：

其中，为掩码矩阵，/>为邻接矩阵，/>为单位矩阵；

邻接矩阵通过下式计算：

其中，为节点/>到节点/>的一条边，/>部件空间关系图的边集；

节点的全局网络卷积表示为：

其中，表示矩阵的哈达玛积；/>，为输出的节点/>的全局矩阵，表示提取到整个传动装置的特征信息；/>为节点/>的卷积核；/>为节点/>的掩码矩阵；/>节点特征提取器提取的节点/>的特征矩阵。

进一步的，特征提取器、全局卷积网络和尺度分类器共同构成全局诊断模型，其中，尺度分类器表示为：

其中，表示尺度分类器识别样本/>为第/>类健康状态的概率；/>表示节点/>中所有健康类别的集合；/>表示节点/>输出的全局矩阵；/>表示向量/>与向量/>的欧氏距离；该式中，分子表示求节点/>中第/>类健康状态特征的一个值，分母表示对节点/>中所有类型健康状态特征的值求和；

为标准样本信息矩阵，表示第/>个节点中样本属于第/>类健康状态的信息，利用如下公式描述：

其中，为第/>个节点中，第/>类健康状态的样本个数；/>为第/>个节点中，第/>类健康状态中，第/>个样本。

进一步的，基础学习阶段中的损失函数的表达式为：

其中，为部件内部损失，/>为部件之间信息传播损失；

其中，表示基础学习阶段中第/>个节点中健康类别的数量；/>表示空间关系图中节点总数；/>表示基础学习阶段样本个数；/>表示基础学习阶段，第/>个节点中第/>类健康状态的样本个数；/>表示指示函数，若括号中为真，则取值为1，否则取值为0；/>表示所对应的列车传动装置健康状态标签，/>，/>表示基础学习阶段的传动装置健康状态标签集合；/>表示第/>个节点的输入样本，/>表示样本/>的全局矩阵；/>表示节点/>中第/>类健康状态的输入样本；/>表示样本/>的全局矩阵。

进一步的，每个学习阶段结束之后，从该学习阶段的数据集中随机抽取一定数量的参考样本，将参考样本和该学习阶段的标准样本信息矩阵共同保存到额外的存储空间，并传递到下一学习阶段。

进一步的，在进阶学习阶段，将上一学习阶段的标准样本信息矩阵衔接至当前学习阶段，包括：

将当前进阶学习阶段的数据集输入到上一学习阶段已训练好的全局诊断模型中，得到当前学习阶段数据集样本的全局特征矩阵；

将当前学习阶段数据集样本的全局特征矩阵输入尺度分类器中，得到当前阶段各样本属于每一类健康状态的概率向量；

基于上一学习阶段保存的标准样本信息矩阵和当前阶段的各样本属于每一类健康状态的概率向量，构造非滞后损失，引导当前阶段全局诊断模型学习上一阶段全局诊断模型。

进一步的，非滞后损失的表达式为：

其中，表示节点，/>表示各个类别健康状态的集合，/>表示第1进阶学习阶段的第/>个节点中属于第/>类健康状态的概率值；/>表示第0阶段的第/>个节点中属于第/>类健康状态的概率值。

进阶学习阶段的损失函数表达式为：

为非滞后损失的权重，/>为部件内部损失，/>为部件之间信息传播损失，为非滞后损失；/>表示第1阶段全局诊断模型的输出结果；/>表示第一阶段样本健康状态标签。

经由上述的技术方案可知，与现有技术相比，本发明具有以下有益效果：

1）本发明根据列车传动装置各个关键部件的连接关系构建了一种空间关系图谱，这能够有效地学习和捕获部件之间的交互，使网络能够发掘各部件之间故障的传播以及耦合关系。

2）本发明建立了一种非滞后渐进学习机制，利用标准样本特征的继承和生成，实现既有诊断知识的积累和新诊断知识的获取，避免了实际应用中长时间等待新故障样本的积累，能够在有限新增样本的约束下，及时学习并诊断新出现的故障。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明提供的基于非滞后渐进学习的列车传动装置全局故障诊断方法的流程图；

图2为本发明提供的全局诊断模型的结构示意图；

图3为本发明提供的渐进式学习的流程示意图；

图4为本发明方法与现有的进阶学习方法的学习性能对比结果示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，本发明实施例公开了一种基于非滞后渐进学习的列车传动装置全局故障诊断方法，包括：一个基础学习阶段和多个进阶学习阶段；

在基础学习阶段，构建全局诊断模型，并获取数据集；

计算基础学习阶段的标准样本信息矩阵；

下面，对上述各步骤做进一步的说明。

（1）基础学习阶段：构造面向列车传动装置的全局诊断模型，并进行初步训练，具体为：

1）根据列车传动装置各个部件的连接结构，将关键部件视为节点，将部件之间的空间邻接关系视为边，构建部件空间关系图，其中，V为节点集，E为边集。

2）为了从原始传感器中捕获到数据特征，构建基于卷积神经网络的特征提取器以提取各节点的特征矩阵；该特征提取器通过交替堆叠的卷积层、池化层和批量处理归一化层来进行信息传递，从而转换到更有效的特征向量，该特征提取过程简化表示为：，其中，/>表示第/>个节点，/>为该节点的特征矩阵，/>为节点特征提取器的非线性映射，/>为输入传感器信号。

3）为了提高节点间信息传播的效率，将每个节点的特征矩阵输入到空间关系图中，引入全局卷积网络，实现非欧图中相邻节点间的信息传播，从而对列车传动装置各部件的相互作用进行建模和解耦。

具体的，为每个节点分配独立的卷积核以融合节点属性，并采用掩码方式实现空间关系图中各节点间的信息传递。

掩码方式具体包括：

其中，为掩码矩阵，/>为邻接矩阵，/>为单位矩阵；

邻接矩阵通过下式计算：

节点的全局网络卷积表示为：

4）为了缓解样本欠完备状态下模型易出现过拟合现象的问题，构造一种新颖的尺度分类器，尺度分类器表示为：

其中，表示尺度分类器识别样本/>为第/>类健康状态的概率；/>表示节点/>中所有健康类别的集合；/>表示节点/>输出的全局矩阵；该式中，分子表示求节点/>中第/>类健康状态特征的一个值，分母表示对节点/>中所有类型健康状态特征的值求和；

表示向量/>与向量/>的欧氏距离，距离公式为：/>；

上述特征提取器模型、全局卷积网络和尺度分类器统称为全局诊断模型，全局诊断模型表示为，其中，/>表示模型处于第/>学习阶段，/>表示第/>阶段中第个节点故障概率矩阵，矩阵中的数字为该样本属于某一类故障的概率值，/>表示第/>阶段的输入样本，/>表示第/>阶段可训练的参数。

5）模型的初步训练：当前为基础学习阶段，记作阶段0，该阶段获取的传动装置不同健康状态的多源传感器信号数据集表示为，其中，/>表示传感器所获取的各个节点的数据样本，/>表示所对应的列车传动装置健康状态标签，/>，/>表示基础学习阶段的传动装置健康状态标签集合，/>表示/>所包含的样本个数。

对基础学习阶段的模型进行训练,该模型为初始阶段构建的全局网络，/>为网络中可学习的参数。

为了使尺度分类器能够正确地进行学习，设计了一个特殊的损失函数，定义为：

其中，为部件内部损失，/>为部件之间信息传播损失；

设置模型基础学习阶段的优化目标为：。

接下来对模型进行初步训练，具体为：

i. 输入训练集，设置损失函数/>，学习率/>。

ii. 将可学习的参数进行初始化。

iii. 前馈计算每一层的输出，直到最后一层，从而转换到更有效的特征向量，实现特征的抽取。

iv. 根据前向传播的结果求损失函数。

v. 利用反向传播算法更新参数，具体地，基于梯度下降算法更新如下所示：

vi. 重复iii-v直到模型收敛。

vii. 得到训练完成的模型和，其中优化后的可训练参数为/>。

基础学习阶段结束之后，从中随机选取一定数量的参考样本/>，并将/>与标准样本信息矩阵/>共同保存到额外的存储空间中，用于将该阶段的信息进阶地传递到下一阶段。

（2）进阶学习阶段，即为阶段1。

在进阶学习阶段，首先，获取具有前一阶段样本中未出现的健康状态的多元传感器信号数据集，其中，/>表示传感器所获取的各个节点的数据样本，/>表示所对应的列车传动装置健康状态标签，/>，/>表示进阶学习阶段1的传动装置健康状态标签集合，且/>，/>表示/>所包含的样本个数。之后，将新获取的传动装置健康状态数据集/>与参考样本/>结合，组成进阶学习阶段模型/>的训练数据集，进行模型的训练。在训练过程中，上一阶段保存的节点信息/>仍可以作为本阶段分类过程的对照信息。在进阶学习阶段采取非滞后渐进学习策略，通过构造一种新颖的非滞后损失函数，将上一阶段中已知有的健康信息衔接到进阶学习阶段，使得模型不需要将所有数据进行重复的训练，仍可以学习上一阶段的健康信息并且灵活地学习到训练集中未出现过的健康信息。

具体的：

1）将当前进阶学习阶段的数据集输入到上一学习阶段已训练好的全局诊断模型中，由于模型在初步训练完成之后，可训练的参数是固定不变的，因此可以得到当前学习阶段数据集样本的全局特征矩阵；

2）将当前学习阶段数据集样本的全局特征矩阵输入尺度分类器中，得到当前阶段各样本属于每一类健康状态的概率向量；

3）基于上一学习阶段保存的标准样本信息矩阵和当前阶段的各样本属于每一类健康状态的概率向量，构造非滞后损失，引导当前阶段全局诊断模型学习上一阶段全局诊断模型的优异性能，使上一阶段的健康信息先接到该阶段模型中。非滞后损失的表达式为：

进阶学习阶段的损失函数表达式为：

设置进阶学习阶段的优化目标：。

4）接下来，对全局诊断模型进行进阶训练，具体为：

i. 输入训练集，设置损失函数/>，学习率/>。

ii. 将可学习的参数初始化。

iii. 前馈计算每一层的输出，直到最后一层，从而转换得到更有效的特征向量，实现特征的抽取。

iv. 根据前向传播的结果求损失函数。

v. 利用反向传播算法进行参数的学习，具体地，基于梯度下降算法更新如下所示：

vi. 重复iii-v直到模型收敛。

vii. 得到训练完成的模型，其中优化后的可训练参数为/>。

在模型训练完成之后，同样地，从中随机选取一定数量的参考样本/>，并将/>与节点信息/>共同保存到额外的存储空间中，用于将该阶段的信息进阶地传递到下一阶段。

3）之后，处于进阶学习阶段，计作阶段，方法同2）。类似的，每个学习阶段结束之后，从该学习阶段的数据集中随机抽取一定数量的参考样本，将参考样本和该学习阶段的标准样本信息矩阵共同保存到额外的存储空间，并传递到下一学习阶段。

下面，通过实验证明本发明方法的性能。

以地铁列车传动系统故障诊断为案例，实验台按照地铁列车转向架进行设计，实验台与实际转向架的比列为1：2，通过故障模拟实验，来验证本发明方法的有效性。实验共考虑了9种工况，通过给转向架设置不同的运行速度来模拟不同的列车速度，施加不同的横向载荷是模拟运行状态是直线或圆角，垂直荷载设为恒值10kn。电机的转速由变频器控制，负载由电液负载设备施加，模拟了32种不同的列车传动系统的健康状态，包括电机故障、齿轮箱故障、左侧轴箱故障、右侧轴箱故障等。对于每个运行状况状态，采集180个样本，每个样本包含3200个采样点。为了制造一个渐进式的学习场景，29种健康状态被划分为5部分，分别安排在5个阶段学习。

实验将本发明提出的方法与传统深度学习方法进行对比，并采用诊断正确率(IA)和诊断遗忘率(IF)来评价各个模型的诊断效果。方法A构建4个单独的网络，分别识别牵引电机、齿轮箱、左轴箱、右轴箱四个节点的健康状态。这些网络的结构与框架中的节点特征提取器和节点分类器一致，但它们的训练是独立的。方法B建立了一个朴素的系统级诊断网络，该网络在宽度维度上将上述四个网络连接起来。方法C使用传统的分类器和传统知识蒸馏方法。网络参数配置见表1，训练相关参数见表2。实验结果被汇总于表3和图4。

表1. 网络参数的配置

表2. 训练相关参数汇总表

表3. 各个节点的诊断准确率

通过实验结果可以看出，在传动系统这样复杂的系统中，本发明方法能全方位地识别各个部件的故障，对于每个节点的诊断准确率都保持着比其它方法更高的诊断准确率。同时面对小样本的约束，本发明方法仍能保持较高的诊断准确率和较低的遗忘率，随着每个阶段的渐进，本发明方法相比于其他方法有着明显的优越性。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种基于非滞后渐进学习的列车传动装置全局故障诊断方法，其特征在于，包括：一个基础学习阶段和多个进阶学习阶段；

在基础学习阶段，构建全局诊断模型，并获取数据集；

计算基础学习阶段的标准样本信息矩阵；

2.根据权利要求1所述的基于非滞后渐进学习的列车传动装置全局故障诊断方法，其特征在于，各部件之间的空间关系图的构建过程包括：

3.根据权利要求1所述的基于非滞后渐进学习的列车传动装置全局故障诊断方法，其特征在于，各节点的全局特征矩阵的计算过程包括：

基于特征提取器提取各节点的特征矩阵；

4.根据权利要求3所述的基于非滞后渐进学习的列车传动装置全局故障诊断方法，其特征在于，掩码方式包括：

；

其中，为掩码矩阵，/>为邻接矩阵，/>为单位矩阵；

邻接矩阵通过下式计算：

；

节点的全局网络卷积表示为：

；

5.根据权利要求4所述的基于非滞后渐进学习的列车传动装置全局故障诊断方法，其特征在于，特征提取器、全局卷积网络和尺度分类器共同构成全局诊断模型，其中，尺度分类器表示为：

；

6.根据权利要求5所述的基于非滞后渐进学习的列车传动装置全局故障诊断方法，其特征在于，基础学习阶段中的损失函数的表达式为：

;

其中，为部件内部损失，/>为部件之间信息传播损失；

；

其中，表示基础学习阶段中第/>个节点中健康类别的数量；/>表示空间关系图中节点总数；/>表示基础学习阶段样本个数；/>表示基础学习阶段，第/>个节点中第/>类健康状态的样本个数；/>表示指示函数，若括号中为真，则取值为1，否则取值为0；/>表示所对应的列车传动装置健康状态标签，/>，/>表示基础学习阶段的传动装置健康状态标签集合；表示第/>个节点的输入样本，/>表示样本/>的全局矩阵；/>表示节点/>中第/>类健康状态的输入样本；/>表示样本/>的全局矩阵。

7.根据权利要求1所述的基于非滞后渐进学习的列车传动装置全局故障诊断方法，其特征在于，每个学习阶段结束之后，从该学习阶段的数据集中随机抽取一定数量的参考样本，将参考样本和该学习阶段的标准样本信息矩阵共同保存到额外的存储空间，并传递到下一学习阶段。

8.根据权利要求1所述的基于非滞后渐进学习的列车传动装置全局故障诊断方法，其特征在于，在进阶学习阶段，将上一学习阶段的标准样本信息矩阵衔接至当前学习阶段，包括：

9.根据权利要求8所述的基于非滞后渐进学习的列车传动装置全局故障诊断方法，其特征在于，非滞后损失的表达式为：

；

10.根据权利要求9所述的基于非滞后渐进学习的列车传动装置全局故障诊断方法，其特征在于，进阶学习阶段的损失函数表达式为：

；

为非滞后损失的权重，/>为部件内部损失，/>为部件之间信息传播损失，/>为非滞后损失；/>表示第1阶段全局诊断模型的输出结果；/>表示第一阶段样本健康状态标签。