CN116244657A

CN116244657A - 基于生成对抗网络和集成学习的列车轴温异常识别方法

Info

Publication number: CN116244657A
Application number: CN202310394434.3A
Authority: CN
Inventors: 郑帅; 张哲�; 张子名; 张艺珲; 周健; 叶鑫; 邢宗义
Original assignee: Nanjing University of Science and Technology
Current assignee: Nanjing University of Science and Technology
Priority date: 2023-04-13
Filing date: 2023-04-13
Publication date: 2023-06-09

Abstract

本发明公开了一种基于生成对抗网络和集成学习的列车轴温异常识别方法，该方法为：采集城轨列车实际运行中的运行数据，预处理后得到一个类别不平衡的二分类数据集，划分为训练集与测试集；利用训练集中的异常数据样本训练生成对抗网络的构造器与判别器，并使用贝叶斯优化算法实现网络的自动调参；利用训练好的生成对抗网络模型合成异常样本，与原始训练集共同构建一个类别平衡的训练集；使用交叉委员会过滤技术对噪声样本进行过滤筛选；利用AdaBoost方法构建轴温异常识别分类器，利用训练集训练该集成学习模型，将测试集输入得到检验结果。本发明解决了城轨列车轴温异常样本缺失和数据不平衡问题，提高了轴温异常识别的准确度和正确率。

Description

基于生成对抗网络和集成学习的列车轴温异常识别方法

技术领域

本发明涉及数据挖掘和城轨列车轴温异常检测技术领域，具体涉及一种基于生成对抗网络和集成学习的列车轴温异常识别方法。

背景技术

为了保障列车的安全可靠运行，对车辆系统的关键部件及运行状态(例如，轴温、受电弓磨耗、羊角状态等)进行在线监控是目前城轨列车系统运行安全保障的重点。利用红外辐射测温，动态测量铁路列车运行状态下的轴承温度，防止列车轴温过高造成燃轴切轴事故，是保证铁路行车安全的重要手段之一。

轴承是城轨列车上的一个关键部件，与列车能否安全运行密切相关。轴温是监测列车轴承健康与否的一项重要指标，目前针对轴温异常检测的方法主要是通过制定相应的逻辑规则与温度阈值来实现轴承状态辨识，但这种轴温异常检测方法具有很大的缺陷，他没有考虑到轴温变化的趋势，没有对历史数据进行系统的分析，也没有考虑速度以及环境温度等因素的影响，无法做到对轴温进行早期的异常检测并发出预警，这意味着一旦发生此类温度报警就意味着列车轴承出现了重大损伤，可能会导致重大事故发生。

近年来利用城轨列车运行时的数据对轴承温度进行异常检测的方法变得十分丰富，但由于城轨列车在实际运行中很少出现事故，所以轴温异常检测领域十分缺少异常样本，导致很多轴温异常检测方法的数据集是极度不平衡的，使得异常识别的正确率和准确度偏低。所以寻找一种能够有效学习异常样本信息且能够有效提高异常识别准确度和正确率的轴温异常检测方法，变得十分重要。对城轨轴温在线检测系统获取的数据分析可知，轴承温度异常情况可分为：微热、强热和激热。将城轨列车正常运行的数据与这三种异常类数据组合形成的数据集，即是一个不平衡的二分类数据集，所以城轨列车轴温异常检测可以抽象为对一个不平衡的二分类数据集进行分类的任务。

针对不平衡数据的分类问题，研究人员已经提出许多的解决方法，生成少数类样本被认为是解决类不平衡的有效方法。其中，随机过采样(ROS)、合成少数类过采样技术(SMOTE)以及基于类边界的合成少数过采样技术(Borderline SMOTE)被人为是最好的传统意义上的过采样算法。但是，在处理类别极度不平衡问题时，这类传统过采样算法的性能会明显下降。

发明内容

本发明的目的在于提供一种基于生成对抗网络和集成学习的列车轴温异常识别方法，结合列车的多元特征并使用生成对抗网络克服在轴温异常检测领域异常样本十分稀缺的问题，同时采用集成学习中AdaBoost算法，进行轴温异常识别的分类训练，提高在类不平衡场景下城轨轴温异常识别的综合性能。

实现本发明目的的技术解决方案为：一种基于生成对抗网络和集成学习的列车轴温异常识别方法，包括以下步骤：

步骤1，对采集到的城轨列车实际运行中的数据进行预处理，得到轴温正常与异常的样本，构成一个类别不平衡的二分类数据集，并将划分为训练集与测试集；

步骤2，构建生成对抗网络模型即CWGAN-GP模型，CWGAN-GP模型为条件Wasserstein生成对抗网络，采用Wasserstein距离来度量实际样本分布与生成样本分布之间的差异，生成器和判别器的输入信息中增加数据类别，并且采用梯度惩罚来代替权值修剪策略，使得生成数据更加多样化；

步骤3、利用训练集中的轴温异常样本训练CWGAN-GP模型的构造器与判别器，并使用贝叶斯优化算法实现网络的自动调参；

步骤4，使用上述训练好的CWGAN-GP模型生成异常样本加入到训练集中，得到类别平衡的训练集；

步骤5，使用交叉委员会过滤技术CVCF，对采样过程中产生的噪声样本进行过滤筛选；

步骤6，采用集成学习中AdaBoost算法构建轴温异常识别分类器，得到集成学习模型，利用经数据筛选后的训练集对集成学习模型进行训练，训练完成后，在测试集上检验分类效果，得到各个评价指标。

进一步地，在步骤1中，对采集到的城轨列车实际运行中的数据进行预处理，具体包括：

提取列车运行的多元数据信息，包括列车车号、列车车型、行驶方向、主控端、环境温度、列车速度、轴箱位置、轴箱温升、轴温温度峰值、轴箱温度平均值；

计算该轴箱与列车同列轴箱平均温度的比值，计为同列比；计算该轴箱与列车全部轴箱平均温度的比值，计为同辆比；提取该列车该轴箱最近五次的温度值，计为五次查询值；同列比、同辆比、五次查询值共同构成轴温多元信息数据集；

将实际数据中的正常样本标记为正类，所有异常类样本标记为负类，并对其中的分类特征进行One-Hot编码，对数据特征进行标准化处理，对缺失和重复的数据进行删除。

进一步地，在步骤2中，CWGAN-GP模型的优化函数为：

其中，Loss_WGAN-GP表示模型的优化函数，z表示噪声，y表示标签信息，E代表期望值，p_r和p_z代表真实数据分布和噪声数据分布，λ是惩罚系数，

是惩罚项，

是真实数据x与合成数据

之间的逐点插值，

是这些线性插值的采样分布，

是判别器的输出相对于插值的梯度；

采用三层全连接层构建CWGAN-GP模型的生成网络和判别网络，去除BN层与dropout层，使用Adam作为优化算法，其中初始学习率α＝0.0001，控制一阶变量β₁＝0.5，控制二阶变量β₂＝0.9；随机噪声从高斯分布中取样，初始长度为100，惩罚系数λ＝10。

进一步地，在步骤3中，利用训练集中的轴温异常样本训练CWGAN-GP模型的构造器与判别器，训练过程中采用贝叶斯优化算法来实现网络的自动调参，在给定目标函数的情况下，以贝叶斯定理为基础，通过不断添加样本点来估计目标函数的后验分布，然后再根据分布选择下一个采样的超参数组合，反复迭代直至估计的目标函数后验分布逼近真实分布。

进一步地，在步骤3中，设定batch size为每轮训练批次大小，n为迭代次数，CWGAN-GP模型的训练过程具体如下：

(3.1)加载数据集，筛选异常样本；

(3.2)定义生成器与判别器，各有3个全连接层；生成器最终输出与数据集具有相同维度的数据作为模拟样本；判别器输出维度为1的数值表示判别结果；

(3.3)从噪声数据分布p_z(z)抽取噪声样本z，从真实数据分布P_r(x)中抽取真实样本x，选取随机数ε∈[0,1]；

(3.4)通过生成器得到合成样本：

(3.5)根据惩罚系数在真实数据与合成数据随机取样：

(3.6)计算判别器损失

(3.7)计算梯度惩罚项

(3.8)重复步骤(3.3)～(3.7)，直至本批次k个样本训练结束；

(3.9)更新判别器参数

(3.10)重复步骤(3.3)～(3.9)，直至迭代n次；

(3.11)从噪声空间取m个样本：

并添加条件信息：

(3.12)计算生成器损失，更新生成器参数：

(3.13)重复步骤(3.3)～(3.12)，直到达到纳什均衡。

进一步地，在步骤4中，类别平衡的训练集构建过程具体如下：

计算出训练集中正负类样本的数量，利用训练好的CWGAN-GP模型生成异常样本，加入到训练集中，使得训练集中的正常样本和异常样本数量差值在设定阈值内，得到类别平衡的训练集。

进一步地，在步骤6中，采用集成学习中AdaBoost算法构建轴温异常识别分类器的具体步骤为：

(6.1)对原始数据集初始化权重；

(6.2)用带权值数据集训练弱学习器；

(6.3)根据弱学习器的误差计算弱学习的权重；

(6.4)调整数据集的权重；

(6.5)重复步骤(6.2)～(6.4)K-1次；

(6.6)将K-1个弱学习器的结果进行加权组合，具体公式为:

其中，H_finall为集成学习得到的强分类器，C_t(x)为第t个决策树弱分类器，sign函数用来取t个弱分类器结果加权后的正负，α_t为第t个决策树弱分类器的权重，e_t为第t个决策树弱分类器分类的错误率。

本发明与现有技术相比，其显著优点为：(1)克服了传统基于阈值的温度异常检测的缺陷，考虑到轴温变化的趋势，对历史数据进行系统的分析，同时考虑速度以及环境温度等因素的影响，能够对轴温进行早期的异常检测并发出预警，能够避免重大事故的发生；(2)结合列车的多元特征使用生成对抗网络，克服了在轴温异常检测领域异常样本十分稀缺的问题，提高了异常识别的正确率和准确度；(3)采用集成学习中AdaBoost算法，进行轴温异常识别的分类训练，提高了在类不平衡场景下城轨轴温异常识别的综合性能。

附图说明

图1为本发明基于生成对抗网络和集成学习的列车轴温异常识别方法的流程图。

图2为本发明基于生成对抗网络和集成学习的列车轴温异常识别方法中CWGAN-GP生成器与判别器的网络结构图。

图3为本发明基于生成对抗网络和集成学习的列车轴温异常识别方法中CWGAN-GP模块的训练流程图。

图4为合成样本与真实样本的高斯核密度估计图。

具体实施方式

本发明提供一种基于改进生成对抗网络和集成学习的城轨列车轴温异常识别方法，包括以下步骤：

作为一种具体示例，在步骤1中，对采集到的城轨列车实际运行中的数据进行预处理，具体包括：

作为一种具体示例，在步骤2中，所述的生成对抗网络(CWGAN-GP)为条件Wasserstein生成对抗网络，其采用Wasserstein距离来度量实际样本分布与生成样本分布之间的差异，生成器和判别器的输入信息中都增加了数据类别，并且采用梯度惩罚来代替权值修剪策略，使得生成数据更加多样化。

CWGAN-GP模型的优化函数为：

是惩罚项，

是真实数据x与合成数据

之间的逐点插值，

是这些线性插值的采样分布，

是判别器的输出相对于插值的梯度。

采用三层全连接层构建CWGAN-GP模型的生成网络和判别网络，因为GP的引入，跟一般GAN、WGAN中通常需要加的BN层会起冲突，去除BN层与dropout层，使用Adam作为优化算法，其中初始学习率α＝0.0001，控制一阶变量β₁＝0.5，控制二阶变量β₂＝0.9；随机噪声从高斯分布中取样，初始长度为100，WGAN-GP中的惩罚系数λ＝10。

作为一种具体示例，在步骤3中，利用训练集中的轴温异常样本训练CWGAN-GP模型的构造器与判别器。因为贝叶斯调参迭代次数少，速度快，而使用网格搜索速度慢,参数多时易导致维度爆炸。训练过程中采用贝叶斯优化算法来实现网络的自动调参，在给定目标函数的情况下，以贝叶斯定理为基础，通过不断添加样本点来估计目标函数的后验分布，然后再根据分布选择下一个采样的超参数组合，反复迭代直至估计的目标函数后验分布逼近真实分布。

(3.1)加载数据集，筛选异常样本；

(3.4)通过生成器得到合成样本：

(3.5)根据惩罚系数在真实数据与合成数据随机取样：

(3.6)计算判别器损失

(3.7)计算梯度惩罚项

(3.8)重复步骤(3.3)～(3.7)，直至本批次k个样本训练结束；

(3.9)更新判别器参数

(3.10)重复步骤(3.3)～(3.9)，直至迭代n次；

(3.11)从噪声空间取m个样本：

并添加条件信息：

(3.12)计算生成器损失，更新生成器参数：

(3.13)重复步骤(3.3)～(3.12)，直到达到纳什均衡。

作为一种具体示例，在步骤4中，类别平衡的训练集构建过程具体如下：

作为一种具体示例，在步骤5中，利用CVCF进行噪声筛选的目的在与：原始轴温数据集中负类样本十分稀少，在经过CWGAN-GP合成一些负类样本后，可能出现噪类样本和类重叠样本，会影响分类器的分类效果。

作为一种具体示例，在步骤6中，采用集成学习中AdaBoost算法构建轴温异常识别分类器的具体步骤为：

(6.1)对原始数据集初始化权重；

(6.2)用带权值数据集训练弱学习器；

(6.3)根据弱学习器的误差计算弱学习的权重；

(6.4)调整数据集的权重；

(6.5)重复步骤(6.2)～(6.4)K-1次；

(6.6)将K-1个弱学习器的结果进行加权组合，具体公式为:

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整的描述。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。

实施例

本实施例提供一种基于改进生成对抗网络和集成学习的城轨列车轴温异常识别方法，该方法包括：

步骤1，对采集到的城轨列车实际运行中的轴温数据进行预处理，得到轴温正常与异常的样本，构成一个别别不平衡的二分类数据集，并将其划分为训练集与测试集；

步骤2，利用轴温异常样本训练改进生成对抗网络模型(CWGAN-GP)的构造器与判别器；

步骤3，使用上述训练好的CWGAN-GP模型生成异常样本，加入到训练集中，使得训练集中的正常样本的异常样本数量相近，得到类别平衡的训练集；

步骤4，使用交叉委员会过滤技术(CVCF)对采样过程中产生的噪声样本进行过滤筛选；

步骤5，利用上述经数据清洗后的训练集训练AdaBoost，训练完成后，在测试集上检验分类效果，得到各个评价指标。

步骤1中，其中本发明方式所使用的点的数据集来自城轨列车在实际运行中传感器所采得的数据，包括异常样本与正常样本。其中预处理操作包括轴温多元特征的提取、去除重复或带有缺失值的行；由于数据集中存在分类特征，是离散的无序的，所以对分类特征列进行One-Hot编码；连续的数字列进行标准化处理，将其缩放成均值为0，方差为1的状态。并按照一定比例划分训练集和测试集；

步骤2中，生成网络和判别网络采用三层全连接层来构建这两个网络，去除了BN层与dropout层，因为这个GP要求判别器的一个输入对应一个输出，但是BN会将一个批次中的样本进行归一化，BN是一批输入对应一批输出，因而用BN后无法正确求出判别器对于每个输入样本的梯度。同时BN层也会引入同个batch中不同样本的互相依赖关系。在构建神经网络的过程中所使用的激活函数包括leaky relu和tanh，同时在判别器上添加sigmod激活函数以获得类别概率，它们的数学表达式为：

除此之外，使用Adam作为优化算法(其中学习率α＝0.0001，β₁＝0.5，β₂＝0.9)。随机噪声从高斯分布中取样，长度为100。WGAN-GP中的惩罚系数λ＝10。

CWGAN-GP的具体训练步骤如下，其中为每轮训练批次大小，n为迭代次数。

(1)加载数据集，筛选异常样本；

(2)定义生成器与判别器，各有3个全连接层。生成器最终输出与数据集具有相同维度的数据作为模拟样本。判别器输出维度为1的数值表示其判别结果；

(3)从噪声数据分布p_z(z)抽取噪声样本z，从真实数据分布P_r(x)中抽取真实样本x,选取随机数ε∈[0,1]；

(4)通过生成器得到合成样本：

(5)根据惩罚系数在真实数据与合成数据随机取样：

(6)计算判别器损失

(7)计算梯度惩罚项

(8)重复第(3)步到第(7)步，直至本批次k个样本训练结束；

(9)更新判别器参数

(10)重复第(3)步到第(9)步，直至迭代n次；

(11)从噪声空间取m个样本：

并添加条件信息：

(12)计算生成器损失，更新生成器参数：

(13)重复第(3)步到第(12)步，直到达到纳什均衡；

同时，由于生成对抗网络对超参数较为敏感，所以使用贝叶斯优化算法来实现网络的自动调参。贝叶斯优化的核心是概率模型和采集函数，概率模型用来表示待评估模型的未知目标函数，通过反复的迭代更新概率模型的参数，可以使估计的目标函数分布逐渐向真实分布靠拢。

步骤3中，构建类别平衡的训练集，具体包括：首先，计算出训练集中正负类样本的数量，计算不平衡率，利用训练好的CWGAN-GP模型生成异常数据样本，最后将合成的异常数据样本加入到训练集中，使得训练集正负类样本数量相同，图4所示为生成样本与真实样本的高斯核密度估计结果；

步骤4中，交叉委员会过滤(CVCF)技术作为一种有效的噪声过滤技术，能够采用交叉验证策略对噪声样本进行有效识别，并在最终分类过程中将其删除；

步骤5中，AdaBoost的具体步骤为：

(1)初始化训练数据的权值分布。对每一个样本最开始都被赋予相同的权值，初始化权值分布

(2)选取一个当前误差率最低的弱分类器h作为第t个基本分类器H_t，并计算弱分类器h_t:X→{-1,1},该弱分类器在分布D_t上的误差为：

(3)计算该弱分类器在最终分类器中所占权重：

(4)更新训练样本的权值分布：

其中Z_t为归一化常数

(5)重复迭代(2)～(4),t＝1,…T；

(6)按照弱分类器权重α_t组合各个弱分类器,通过符号函数sign的作用，得到一个强分类器

本实施例基于改进生成对抗网络和集成学习的城轨列车轴温异常识别方法，进行以下仿真：构建城轨列车轴温异常识别二分类数据集，该数据集包括2000个城轨列车轴温的数据，其中故障数据256个，正常数据1744个，进行预处理后，使用SMOTEBagging、SMOTEBoost、EasyEnsemble和BalanceCascade以及本发明所提出的CWGAN-AdaBoost算法在数据集上进行分类训练，在训练集上比较各个性能指标。选用准确率Accuracy、召回率Recall、AUC、G-mean值和F1作为评价指标，且各个评价指标取5折交叉验证的平均值作为最终结果。分类所构造的混淆矩阵如表1所示：

表1分类所构造的混淆矩阵

其中，AUC对应的是分类器给随机选择的正类样本的预测概率比随机选择的负类样本的预测概率大。这从根本上避免了类别不平衡对评价指标的影响；G-mean以一种平衡的方式评估多数类和少数类的准确性。G-mean的另一个重要特征是非线性，错误分类对少数群体类的G-mean度量有更大的影响，从而避免了因忽视重要的少数类样本而造成的损失；F1 score是一个平均数，是对精确率与召回率进行平均的一个结果，同时兼顾了精确率与召回率，它们的计算公式为：

表2实验结果对比表

本发明的实验效果如表2所示，由表2可知，在城轨列车轴温异常识别分类数据集上的表现，本发明所提出的方法在各个评价指标上均优于SMOTEBagging、SMOTEBoost、EasyEnsemble和BalanceCascade.

综上所述，本发明克服了传统基于阈值的轴温异常识别的缺陷，结合轴温的多元信息数据构成数据集，并通过生成对抗网络生成稀缺的异常样本来降低数据集的不平衡度，同时采用CVCF算法来减轻噪声对分类性能的影响，并采用AdaBoost集成来对数据集进行分类，实验结果表明，本发明方法对轴温异常识别的识别综合性能得到提高。

Claims

1.一种基于生成对抗网络和集成学习的列车轴温异常识别方法，其特征在于，包括以下步骤：

2.如权利要求1所述的基于生成对抗网络和集成学习的列车轴温异常识别方法，其特征在于，在步骤1中，对采集到的城轨列车实际运行中的数据进行预处理，具体包括：

3.如权利要求1所述的基于生成对抗网络和集成学习的列车轴温异常识别方法，其特征在于，在步骤2中，CWGAN-GP模型的优化函数为：

是惩罚项，

是真实数据x与合成数据

之间的逐点插值，

是这些线性插值的采样分布，

是判别器的输出相对于插值的梯度；

4.如权利要求3所述的基于生成对抗网络和集成学习的列车轴温异常识别方法，其特征在于，在步骤3中，利用训练集中的轴温异常样本训练CWGAN-GP模型的构造器与判别器，训练过程中采用贝叶斯优化算法来实现网络的自动调参，在给定目标函数的情况下，以贝叶斯定理为基础，通过不断添加样本点来估计目标函数的后验分布，然后再根据分布选择下一个采样的超参数组合，反复迭代直至估计的目标函数后验分布逼近真实分布。

5.如权利要求4所述的基于生成对抗网络和集成学习的列车轴温异常识别方法，其特征在于，在步骤3中，设定batch size为每轮训练批次大小，n为迭代次数，CWGAN-GP模型的训练过程具体如下：

(3.1)加载数据集，筛选异常样本；

(3.4)通过生成器得到合成样本：