CN115512460A

CN115512460A - 一种基于图注意力模型的高速列车轴温长时预测方法

Info

Publication number: CN115512460A
Application number: CN202211212174.5A
Authority: CN
Inventors: 董宏辉; 满洁; 贾利民; 秦勇
Original assignee: Beijing Jiaotong University
Current assignee: Beijing Jiaotong University
Priority date: 2022-09-29
Filing date: 2022-09-29
Publication date: 2022-12-23
Anticipated expiration: 2042-09-29
Also published as: CN115512460B

Abstract

本发明公开了属于数据挖掘技术领域的一种基于图注意力模型的高速列车轴温长时预测方法，该方法首先从高速列车的转向架上采集传感器数据，使用嵌入式架构融合GAT模型和门限循环GRU模型构建GRGAT框架，用于对时空预测进行聚合；使用图注意力网络GAT模型和生成对抗网络GAN模型，分析列车运行周期性变化的特点，使用GAN网络构建时间条件序列对历史轴温信息进行融合，得到高速列车轴温长时预测的GA‑GRGAT模型，实验结果显示，本发明在进行长时预测时，在两个数据集上的准确度均高于80％以上，可以满足高精度、长时间的轴温预测需求。

Description

一种基于图注意力模型的高速列车轴温长时预测方法

技术领域

本发明属于数据挖掘技术领域，特别涉及一种基于图注意力模型的高速列车轴温长时预测方法。

背景技术

目前绝大多数关于轴温进行预测的模型都是短时预测模型，虽然能够取得不错的效果，但是受限于预测模型感知范围，一般仅预测1小时之内的轴温变化情况。这对于处理列车紧急故障而言已经有足够的时间，但是对于超过1天的列车长时轴温预测没有过多的研究。

实际上，长时轴温预测在列车状态评估和日常维护中具有十分重要的作用。例如，列车转向架作为机械部件，随着列车的运行，转向架也在不断地磨损。如果可以提前预测转向架运行1天甚至是1周的状态变化情况，可以帮助列车管理与维护人员提前对可能出现故障的部件进行检修和维护。此外，随着我国高速铁路的发展，长时列车逐渐普遍。在高速列车实际开行计划中，有超过15h运行的高速列车，而如何对长时轴温数据进行合理建模是一个亟待解决的难题。

随着移动互联网的发展和车载设备的更新迭代，轴温检测不再局限于人工巡检方式，以传感器检测系统和大数据平台为依托的实时检测技术逐渐成为主流的轴温检测手段。与此同时，列车运行信息也有了爆炸式增长。海量的列车实时检测数据为轴温预测的研究提供了坚实的数据基础。受益于列车轴温数据的扩增，基于数据驱动的机器学习模型可以更加有效地挖掘列车轴温数据中隐含的时间特征和空间特征，在处理系统级别的轴温数据时，显示出比仿真等传统方法更强大的潜力。

发明内容

本发明的目的是提出一种基于图注意力模型的高速列车轴温长时预测方法，其特征在于，包括以下步骤：

步骤1、从高速列车的转向架上采集传感器数据，对传感器数据进行清洗、去噪处理，使用皮尔森相关系数对转向架上的传感器进行特征筛选，得到与轴温变化最相关的传感器数据；

步骤2、构建轴温信息图结构；

步骤3、获取步骤1的时间序列数据和步骤2的图结构，使用GRU(门限循环单元)模型有效提取高速列车轴温的时序特征，使用GAT(图注意力网络)模型有效提取列车转向架图结构的空间特征；结合GRU模型和GAT模型，使用GAT 单元代替GRU内部原有的线性连接层，从而构建可以融合列车轴温的时空信息的 GRGAT单元；

步骤4、基于生成对抗网络构建生成器和判别器，其中生成器和判别器都包括了编码操作和解码操作；

步骤5、基于生产对抗网络和GRGAT单元构建高速列车轴温长时预测 GA-GRGAT模型；并基于Pytorch深度学习框架融合列车轴温的时空信息的GRGAT 单元的GA-GRGAT模型训练；

步骤6：使用高速列车真实在途运行数据带入GA-GRGAT模型，得到轴温的长时预测值。

所述步骤2中图结构定义如下所示：

其中Graph代表一个网络，V是网络中的一组顶点，E是网络Graph中的一组边，并且e_ij表示从节点v_i到v_j的方向；此外，W是网络Graph中的一组权重，w_ij表示从节点v_i到v_j的权重。

所述步骤3具体按以下步骤实施：

步骤31，将t时刻的轴温数据输入X_t和t-1时刻的隐藏层输出h_t-1横向拼接得到更新门Z_t＝[h_t-1||X_t]，将GRU模型原有的线性重置门r_t和更新门z_t使用两个不同的K层GAT网络替代；具体公式如下所示：

r_t＝σ(GAT_r ^K(Z_t))

z_t＝σ(GAT_z ^K(Z_t))

其中

σ(·)为sigmoid激活函数；

步骤,32：将t-1时刻的隐藏层输出h_t-1与t时刻的重置门r_t相乘，然后和t时刻的轴温数据X_t输入，横向拼接得到Z′_t＝[r_t*h_t-1||X_t]，将GRU模型原有的线性单元 GAT_x ^K使用一个K层GAT网络替代，从而计算t时刻的隐藏层h_t输出；公式如下所示：

h_t＝(1-z_t)⊙h_t-1+z_t⊙(tanh(σ(GAT_x ^K(Z′_t))))。

所述步骤3中GAT模型，定义t时刻输入GAT模型的列车轴温数据为

列车转向架图结构的邻接矩阵A∈R^n×n，n为列车转向架图结构的顶点数量，p为输入列车轴温属性的维度，

为可学习参数，q为输出的列车轴温的特征维度，节点i的重构向量

如下所示

其中，LeakyReLU(w^T[Wx_i||Wx_j])为激活函数，exp(LeakyReLU(w^T[Wx_i||Wx_j])) 为指数操作，时刻i和时刻j的轴温为x_i和x_j，节点i和节点j的一阶领域为

和

学习参数为W，训练参数为w。

所述步骤4具体按以下步骤实施：

步骤41，生成器构建

(1)编码器输入阶段，在该阶段首先将t时刻输入的列车转向架时序特征C_t，通过f_MLP映射为C′_t∈R^n×1，然后将列车轴温数据X_t和时序特征C′_t进行拼接，拼接的结果作为GRGAT单元的输入；

(2)解码器生成阶段，首先将C_t按照Step 1的方法通过f_MLP映射为C′_t∈R^n×1，然后将t-1时刻由Step 1输出的数据

和C′_t进行拼接，拼接的结果作为GRGAT 单元的输入，经过循环收敛之后得到隐藏矩阵h_t和输出矩阵y_t。其中，需要在解码器阶段使用注意力机制，使用注意力单元Att将y_t映射为

步骤42，判别器构建

(1)t时刻输入的时序特征C_t，通过f_MLP1映射为C′_t∈R^n×1。映射向量C′_t与温度信息X_t进行拼接，输入GRGAT单元进行循环，迭代之后得到隐藏矩阵 H＝(h₁,h₂,...,h_l+r)和输出矩阵Y＝(y₁,y₂,...,y_l+r)；

(2)将y_t映射为t时刻带有自注意力机制的映射向量；

(3)f_MLP2将

映射为真实数据的概率P。

所述步骤6具体按以下步骤实施：

步骤61，生成器生成序列

在t时刻编码器(Encoder)的轴温数据X_t为输入和时序特征C_t，经过l步循环迭代之后，得到Z和H_E，在解码器(Decoder)的输入数据为上一时刻的

和 C_t，计算得到

再经过r步循环迭代之后得到

步骤62，判别器判别真伪

样本数据包含两个部分，分别是序列数据和标签数据。前者的长度为l+r，包括X_t和C_t；后者为0或者1；

步骤63，对抗训练

对生成器G和判别器D进行初始化得到G₀和D₀，具体步骤如下所示：

(1)G₀不变，优化D₀得到D₁，优化方法为梯度下降算法；

(2)D₁不变，优化G₀得到G₁，优化方法与第一步相似；

(3)在模型收敛之前重复上述两个步骤对G和D进行优化，最终得到最佳的G^*和D^*，其中，G^*即为预测阶段使用的生成器。

所述步骤5基于Pytorch深度学习框架融合列车轴温的时空信息的GRGAT单元的GA-GRGAT模型训练；GA-GRGAT模型的训练算法伪代码如下所示：

本发明的有益效果是本发明选取轴温作为轴承状态监测特征，将图结构引入到高速列车轴温预测的场景中，形成轴温网络。基于轴温网络，使用嵌入式架构融合图注意力网络GAT模型和门限循环单元GRU模型构建了GRGAT框架，其中GAT 模型较图卷积神经网络GCN模型而言，使用注意力机制针对不同的邻居学习不同的权重，有效解决了图中的动态卷积操作；然后使用生成对抗网络GAN模型构建时间时序特征，对历史列车轴温信息进行融合，从而提高GA-GRGAT模型的长时预测准确度；本发明的轴温长时预测可以为列车日常维护和状态提供决策依据。

附图说明

图1动力转向架单轴温度传感器分布情况。

图2网络结构构造流程

图3 GRGAT单元的结构。。

图4 GA-GRGAT结构图。

图5数据集v₁上不同时刻的24小时温度预测。

图6数据集v₂上不同时刻的24小时温度预测。

图7高速列车轴温长时预测流程图。

具体实施方式

本发明提出一种基于图注意力模型的高速列车轴温长时预测方法，高速列车轴温监测系统采用在转向架上电机、齿轮箱、轴箱等关键部件中轴承位置附近安装温度传感器的方式来实现对轴承温度的实时采集监测功能。每个转向架配置有两根轴，这两根车轴及其包括电机、轴箱、齿轮箱的关联结构是对称分布的，每根轴对应有9个测点，如图1中标号①-⑨所示：

①：齿轮箱附近车轴测点 ②：车轮侧大齿轮箱测点 ③：车轮侧小齿轮箱测点

④：电机侧大齿轮箱测点 ⑤：电机侧小齿轮箱测点 ⑥：电机驱动端测点

⑦：电机定子测点 ⑧：电机非驱动端测点 ⑨：电机附近车轴测点

即每个转向架共装有18个温度传感器。下面结合附图对本发明予以进一步说明。本发明方法包括以下步骤(如图7所示)：

步骤2、构建轴温信息图结构；

具体说明如下：

(1)构建轴温信息图结构

图1展示了高速列车动力型车厢底部转向架的基本结构以及对应的温度传感器安装布置情况。

本发明规定车辆数据检测点表示为高速列车图结构的顶点(如图1中标号① -⑨所示)，检测点之间的关系为图的边，检测点之间的相关系数为图结构边的权重。另外，检测点之间的因果关系是图结构的边的方向。高速列车图结构定义如下所示：

其中Graph代表一个网络，V是网络中的一组顶点，E是Graph中的一组边，并且e_ij表示从节点v_i到v_j的方向。此外，W是Graph中的一组权重，w_ij表示从节点v_i到v_j的权重。

由于列车转向架各个测点的空间相关性，可以根据转向架各个测点的实际结构构造二维网络，作为后续的输入。我们将每个测点看作网络的顶点，将转向架上各测点的实际连接关系抽象成网络的边，按照灰色-格兰杰构造(Gray– Granger Causality，即GGC)方法构造传感器数据网络。构造流程如图2所示。

(2)GAT模型架构

定义t时刻输入GAT模型的列车轴温数据为

如下所示：

本发明选择GRU模型(门限循环单元)，有效提取高速列车轴温的时序特征，使用GAT模型有效提取列车转向架图结构的空间特征。结合GRU模型和GAT模型，使用GAT单元代替GRU内部原有的线性连接层，从而构建可以融合列车轴温的时空信息的GRGAT框架。规定GRGAT框架中的重置门r_t表示为GAT_r ^K，更新门z_t表示为GAT_z ^K，与横向X拼接后的线性单元GAT_x ^K，同时隐藏层单元数量为c。GRGAT 单元结构如图3所示。

GRGAT单元的计算过程如下所示：

步骤3-1：将t时刻的轴温数据X_t输入和t-1时刻的隐藏层h_t-1为输出，横向拼接得到Z_t＝[h_t-1||X_t]，将GRU模型原有的线性重置门r_t和更新门z_t使用两个不同的K层GAT网络替代，具体公式如下所示：

r_t＝σ(GAT_r ^K(Z_t))

z_t＝σ(GAT_z ^K(Z_t))

其中

σ(i)为sigmoid激活函数。

步骤3-2：将t-1时刻的隐藏层输出h_t-1与t时刻的重置门r_t相乘，然后和t时刻的输入X_t横向拼接得到Z′_t＝[r_t*h_t-1||X_t]，将GRU模型原有的线性单元GAT_x ^K使用一个K层GAT网络替代，从而计算t时刻的输出h_t，公式如下所示：

h_t＝(1-z_t)⊙h_t-1+z_t⊙(tanh(σ(GAT_xK(Z′_t))))

(3)生成对抗网络构建

GAN主要由生成器和判别器组成。本发明生成器和判别器的构建，为后续 GA-GRGAT模型奠定了基础。生成器和判别器都包括了编码器(Encoder)和解码器(Decoder)，具体过程如下所示：

步骤一：生成器构建

步骤1-1：编码器输入阶段

在该阶段首先将t时刻输入的C_t(列车转向架时序特征)通过f_MLP映射为 C′_t∈Rⁿ ^×1，然后将列车轴温数据X_t和C′_t进行拼接，拼接的结果作为GRGAT单元的输入，具体公式如下所示：

(Z,H_E)＝GRGAT^(l)(X_t||f_MLP(C_t)；A)

其中GRGAT^(l)表示将GRGAT单元循环迭代了l次，Z为隐藏矩阵，H_E为隐藏序列。

步骤1-2：解码器生成阶段

首先将C_t按照Step 1的方法通过f_MLP映射为C′_t∈R^n×1，然后将t-1时刻由Step 1输出的数据

和C′_t进行拼接，拼接的结果作为GRGAT单元的输入，经过循环收敛之后得到隐藏矩阵h_t和输出矩阵y_t。其中，需要在解码器阶段使用注意力机制，使用注意力单元Att将y_t映射为

具体的计算公式如下所示：

步骤二：判别器构建

在该模型中，高速列车转向架时序特征C＝(C₁,C₂,...,C_l+r)和状态序列 X＝(X₁,X₂,...,X_l)是G的输入数据；高速列车轴温预测序列

是G的输出数据。生成序列定义为X_G，真实序列定义为X_R，对应的时序特征为C，没有对应关系的时序特征为

则X_G与X_R的定义如下所示：

X_R＝(X₁,X₂,…,X_l,X_l+1,…,X_l+r)

样本分为两类真实样本X_Real和假样本X_Fake。X_R和C作为X_Real的输入特征，若标签是1，则X_Real为真。X_Real的定义如下所示：

X_Real＝{X＝X_R&C；Y＝1}

假样本可以进一步划分为两类，第一类的输入特征是X_G和C，第二类的输入特征是X_R和

两类假样本的输出结果(标签)均为0。假样本X_Fake的定义如下所示：

温度时空数据X_R与X_G，时序特征C与

作为判别器M的输入序列数据，能够使用GRGAT框架捕捉序列时空特征。为了进一步加强时空序列的特征融合能力，在判别器中加入了Self-Attention模块。

综上，判别器M的计算过程如下所示：

Step 1：t时刻输入的时序特征C_t，通过f_MLP1映射为C′_t∈R^n×1。映射向量C′_t与温度信息X_t进行拼接，输入GRGAT单元进行循环。迭代之后得到隐藏矩阵 H＝(h₁,h₂,...,h_l+r)和输出矩阵Y＝(y₁,y₂,...,y_l+r)，计算公式如下所示：

(H,Y)＝GRGAT^(l+r)(X_t||f_MLP1(C_t)；A)

Step 2：Self-Attention将y_t映射为

具体如下所示：

其中

表示在t时刻带有自注意力机制的映射向量，H表示计算注意力系数。

Step 3：f_MLP2将

映射为真实数据的概率P，如下所示：

(4)GA-GRGAT长时预测模型

GA-GRGAT模型分为生成器G和判别器M两个部分，具体计算步骤如下所示：

步骤一：生成器生成序列

在t时刻译码器(Encoder)的输入数据为X_t和C_t，经过l步循环迭代之后，得到Z和H_E。Z的作用是使解码器初始化隐藏状态。在t时刻M的输入数据为上一时刻的

和C_t，引入ATT(注意力机制)，计算得到

再经过r步循环迭代之后得到

步骤二：判别器判别真伪

样本数据包含两个部分，分别是序列数据和标签数据。前者的长度为l+r，包括X_t和C_t；后者为0或者1。在t时刻，判别器M的输入数据X_t和C_t，经过l+r 次循环之后，结合Self-Attention和MLP计算，得到判别数据P∈[0,1]。

步骤三：对抗训练

对生成器G和判别器D进行初始化得到G₀和D_0，具体步骤如下所示：

1)G₀不变，优化D₀得到D₁，优化方法为梯度下降算法；

2)D₁不变，优化G₀得到G₁，优化方法与第一步相似；

3)在模型收敛之前重复上述两个步骤对G和D进行优化，最终得到最佳的G^*和D^*，其中，G^*即为预测阶段使用的生成器。

GA-GRGAT模型总体架构如图4所示。GA-GRGAT模型的构建和训练基于 Pytorch深度学习框架。则GA-GRGAT模型的训练算法伪代码如下所示：

(5)进一步说明本发明的有效性，本发明实验中使用的数据均来自高速列车实际运行产生的状态监测数据，为了考虑外界温度对列车轴温序列的影响，选择春天(日平均温度15℃)和夏天(日平均温度30℃)两个数据集，数据集的时间范围分别为2019年3月15日至2019年4月15日和2019 年7月15日至2019年8月15日，具体划分日期和数据集大小如表1所示。

表1 GA-GRGAT数据集说明

如表1所示，将每个数据集按照训练集、测试集和验证集进行划分，划分比例约为4:1:1(训练集22天，测试集5天，验证集5天)。规定输入序列长度为l，输出序列长度为r，传感器数量为18，t时刻条件特征C_t是由5 个one-hot向量拼接而成的37维向量。

此外，考虑到长时列车轴温预测的实时性要求较低，GA-GRGAT模型训练速度慢，本发明对列车轴温序列进行整时刻切分，采样的时间间隔为 5min，将样本集大小缩减到原来的1/12。数据示例如表2所示。

表2数据示例

1)评价标准

GA-GRGAT模型使用四种评价指标，分别是平均绝对误差(Mean Absolute Error，MAE)、均方根误差(Root Mean Square Error，RMSE)、平均绝对百分比误差(MeanAbsolute Percentage Error，MAPE)和需求预测准确度 (Forecast Accuracy，Accuracy)作为评价指标。其中MAE直接表示绝对误差大小；RMSE反映偏差分布的离散情况；MAPE为无量纲评价指标，反映模型预测值的偏离程度和可信度；Accuracy指的是预测准确率(Forecast Accuracy)，一般使用1-MAPE的值表示。具体公式如下所示：

式中，s表示样本集内的样本个数，n表示轴温网络中监测点数量，

表示预测值，y_ij表示真实值，

表示预测值的平均值，

表示真实值的平均值。

2)实验环境

GA-GRGAT模型及其对比方法进行高速列车轴温长时预测的实验环境如表3所示。其中，GA-GRGAT模型及其对比方法均使用Python语言实现，本发明使用的深度学习架构均为PyTorch库。GA-GRGAT模型的训练主要在GPU 上进行。

表3实验环境说明

3)实验结果分析

本发明采用GRU、GOAMLP、DCNN、SVR、HA五种经典的时序预测模型和 GRGAT、GA-GRGAT模型对比。所有模型均使用相同的训练集和测试集，本发明使用春天数据集v₁和夏天数据集v₂进行预测，预测结果如表4所示。

表4两个数据集在不同模型下的比较结果

从表4可以看出，GA-GRGAT模型所有评价指标均为最优。基于GRGAT框架的GA-GRGAT模型和GRGAT模型排在前两位，预测性能较好，说明GRGAT 单元可以有效融合温度时空信息。同时GA-GRGAT模型优于GRGAT模型，说明GAN的有效性。而在GRU模型、GOAMLP模型、DCNN模型、SVR模型和HA 模型中，经典神经网络模型(GRU模型、GOAMLP模型和DCNN模型)的效果优于传统时序模型(SVR模型和HA模型)。SVR模型预测精度最低，甚至低于HA模型。另外值得关注的是，GA-GRGAT模型的MAE值为2.58时，RMSE 值仅为3.91。而GRGAT模型的MAE值为5.85，RMSE值为8.8。从MAE值可以看出，GA-GRGAT预测结果的聚合性比较强，也就是说模型的误差不分散，体现在轴温上来看，GA-GRGAT模型预测的结果可以体现整体的温度变化趋势。

本发明对GA-GRGAT模型、GRGAT模型和GOAMLP模型和GRU模型不同步长的准确率和消耗时间(Cost time)进行统计。具体结果如表5所示。

表5不同模型准确率和消耗时间的比较结果

从表5可以看出，GA-GRGAT模型的准确率在相同步长和数据集的情况下高于GRGAT、GRU、GOAMLP和DCNN模型，且在两个数据集上GA-GRGAT模型的准确率均大于85％，其中在24th、36th和48th的情况下准确率大于90％，说明使用GA-GRGAT模型预测未来一天的列车轴温变化情况有较高的精度。此外，对每个模型不同步长的准确率进行对比可以看出，随着步长增大，模型的输入和输出数据量增加，导致消耗时间变长，但是准确率也会随之提高。GA-GRGAT模型的消耗时间在所有模型中只比GOAMLP模型稍低，比其他模型的时间更长，在48th时消耗时间为129.90s，约2min，可以保证列车长时预测实时性的需要。

本发明选择GRGAT模型、GRU模型和COAMLP模型与GA-GRGAT模型进行对比，直观观察每个模型的预测效果。分别从0时、6时、12时和18时开始，输入序列长度l＝12，预测后续24小时之内的列车轴温数据。本发明使用春天数据集v₁和夏天数据集v₂的测试集进行预测，预测效果如图5和图6 所示。

GA-GRGAT模型在图5(a)～(c)和图6(a)～(c)中明显优于GRGAT 模型、GRU模型和COAMLP模型。也就是说，GA-GRGAT模型从0：00、6：00 和12：00开始预测未来24小时内的轴温都有较为理想的效果。而比较四个模型在18：00预测未来24小时内的轴温效果，可以看出GA-GRGAT模型和 COAMLP模型要明显优于GRGAT模型和GRGAT模型。

综上所述，本发明的轴温长时预测可以为列车日常维护和状态修提供决策依据。本发明选取轴温作为轴承状态监测特征，将图结构引入到高速列车轴温预测的场景中，形成轴温网络。基于轴温网络，使用嵌入式架构融合图注意力网络(Graph AttentionNetwork，即GAT)模型和门限循环单元(Gate Recurrent Unit，即GRU)模型构建了GRGAT框架，其中GAT模型较图卷积神经网络(Graph Convolutional Network，即GCN)模型而言使用注意力机制针对不同的邻居学习不同的权重，有效解决了图中的动态卷积操作；然后使用生成对抗网络(Generative Adversarial Networks，GAN) 模型构建时间时序特征对历史列车轴温信息进行融合，从而提高GA-GRGAT 模型的长时预测准确度和GCN模型。

Claims

1.一种基于图注意力模型的高速列车轴温长时预测方法，其特征在于，包括以下步骤：

步骤2、构建轴温信息图结构；

步骤3、获取步骤1的时间序列数据和步骤2的图结构，使用GRU(门限循环单元)模型有效提取高速列车轴温的时序特征，使用GAT(图注意力网络)模型有效提取列车转向架图结构的空间特征；结合GRU模型和GAT模型，使用GAT单元代替GRU内部原有的线性连接层，从而构建可以融合列车轴温的时空信息的GRGAT单元；

步骤5、基于生产对抗网络和GRGAT单元构建高速列车轴温长时预测GA-GRGAT模型；并基于Pytorch深度学习框架融合列车轴温的时空信息的GRGAT单元的GA-GRGAT模型训练；

2.根据权利要求1所述的基于图注意力模型的高速列车轴温长时预测方法，其特征在于，所述步骤2中图结构定义如下，：