CN112633550A - 一种基于rnn的接触网故障趋势预测方法、设备及存储介质 - Google Patents

一种基于rnn的接触网故障趋势预测方法、设备及存储介质 Download PDF

Info

Publication number
CN112633550A
CN112633550A CN202011324024.4A CN202011324024A CN112633550A CN 112633550 A CN112633550 A CN 112633550A CN 202011324024 A CN202011324024 A CN 202011324024A CN 112633550 A CN112633550 A CN 112633550A
Authority
CN
China
Prior art keywords
defect
neural network
data
hidden
rnn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011324024.4A
Other languages
English (en)
Other versions
CN112633550B (zh
Inventor
占栋
黄瀚韬
张金鑫
钟尉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Tangyuan Electric Co Ltd
Original Assignee
Chengdu Tangyuan Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Tangyuan Electric Co Ltd filed Critical Chengdu Tangyuan Electric Co Ltd
Priority to CN202011324024.4A priority Critical patent/CN112633550B/zh
Publication of CN112633550A publication Critical patent/CN112633550A/zh
Application granted granted Critical
Publication of CN112633550B publication Critical patent/CN112633550B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Strategic Management (AREA)
  • Computing Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Neurology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于RNN的接触网故障趋势预测方法、设备及存储介质,涉及接触网技术领域。本发明通过循环神经网络提取接触网缺陷演变的时间规律,其中采用GRU(门控循环单元)作为隐藏层单元,不仅包括当前所见的输入样例,还包含之前时刻感受的信息,充分考虑时间序列的动态特性,进而获得更精准的接触网缺陷预测结果。本发明将循环神经网络用于缺陷统计量的时间序列预测,通过GRU单元充分考虑到接触网缺陷统计序列的时间关联关系,能够准确学习缺陷统计量的时间变化规律。

Description

一种基于RNN的接触网故障趋势预测方法、设备及存储介质
技术领域
本发明涉及接触网故障预测技术领域,更具体地说涉及一种基于RNN的接触网故障趋势预测方法、设备及存储介质。
背景技术
在电气化铁路中,接触网通过接触线与受电弓之间的滑动接触,为电力机车提供电能。接触网由于其结构复杂,加上恶劣的自然天气考验,易发生故障,从而对铁路安全运行造成隐患。因此,对接触网各类缺陷发生趋势进行有效预测具有重要意义。
接触网缺陷预测是将定义的接触网系统缺陷统计量按时间排序,通过对接触网检测监测数据、故障数据、运行工况与外部环境等历史数据的挖掘分析,得出缺陷统计量反映出来的发展过程和变化规律,进行类推,预测下一段时间接触网系统缺陷发生率可能达到的水平。
现有的接触网故障预测方法多采用移动平均、指数平滑等传统方法,都假定接触网缺陷时间序列统计量符合线性关系,但接触网缺陷信息的多层次和关联性使得其时间序列呈现非常复杂的非线性,也正由于实际场景中的接触网缺陷统计量时间序列具有大量非线性特征,传统的时间序列分析方法难以对其建立可靠稳定的预测模型。
发明内容
为了克服上述现有技术中存在的缺陷和不足,本发明提供了一种基于RNN(循环神经网络)的接触网故障趋势预测方法,本发明的发明目的在于解决传统时间序列分析方法处理非线性时间序列的局限性。本发明通过RNN(循环神经网络)提取接触网缺陷演变的时间规律,其中采用GRU(Gated Recurrent Unit,门控循环单元)作为隐藏层单元,不仅包括当前所见的输入样例,还包含之前时刻感知的信息,充分考虑时间序列的动态特性,进而获得更精准的接触网缺陷预测结果。
为了解决上述现有技术中存在的问题,本发明是通过下述技术方案实现的:
一种基于RNN的接触网故障趋势预测方法,包括以下步骤:
步骤一,采用接触网缺陷统计量样本序列训练用于接触网故障趋势预测的循环神经网络模型;
步骤二,输入接触网缺陷统计量实际序列至训练后的所述循环神经网路模型输入层,以所述循环神经网络的输出层数据作为接触网缺陷统计量趋势序列;
其中,步骤一包括:
步骤11,对接触网缺陷数据按预设周期进行划分统计,得到每预设周期的接触网缺陷数据原始统计量;对所述接触网缺陷数据原始统计量进行分布变换处理,构建用于训练循环神经网络的接触网缺陷统计量样本序列;
步骤12,按时间顺序从所述接触网缺陷统计量样本序列中选取部分数据作为所述循环神经网络的首次训练数据;
步骤13,根据接触网缺陷的分布复杂度确定所述循环神经网络隐藏层数量;
步骤14,根据缺陷特征的时间相关性确定输入节点数;根据需要预测缺陷的步数确定输出节点数;根据柯尔莫格洛夫定理确定隐藏层神经元个数,或者根据接触网缺陷的样本数、样本噪声和样本规律的复杂程度确定隐藏层神经元个数,上述隐藏层神经元采用门控循环单元;
步骤15,采用动态变化学习效率方式对所述循环神经网络进行迭代优化;
步骤16,使用训练数据计算循环神经网络的各参数权重值,得到训练后的循环神经网络模型;
所述步骤二包括:
步骤21,对接触网缺陷统计量实际序列进行分布变换处理,并输入至训练后的循环神经网络模型;
步骤22,对所述循环神经网络的输出层数据做逆分布变换处理并将结果作为接触网缺陷统计量趋势序列。
更进一步地,步骤一还包括步骤17,即步骤16之后,若还有缺陷统计量数据未使用,则加入部分新数据重复步骤12至步骤16;若所有数据均已使用,则现有权重值为神经网络最终权重值,将神经网络最终权重值代入到神经网络模型中,进行接触网缺陷统计量趋势预测。
更进一步地,所述步骤11中,对所述接触网缺陷数据原始统计量进行分布 变换处理,具体是指,采用min-max方法归一化待预测特征数据集;若M(t)为 第t个样本数据,I(t)为第t个训练数据,则转换公式为:
Figure RE-GDA0002948925720000031
所述步骤22中对所述循环神经网络的输出层数据做逆分布变换处理,具体 是指,若O(t)表示为逆归一化之后的缺陷预测值,o(t)表示为预测值,则逆分 布变换公式为:O(t)=o(t)*(max(M(t))-min(M(t)))+min(M(t))。
所述步骤12中,按时间顺序从所述接触网缺陷统计量样本序列中选取40%数据作为所述循环神经网络的首次训练数据。
所述步骤14中,隐藏神经元的个数由以下两种方式中的任意一种确定;
方式一,隐含层节点数s=2n+1,其中n为输入层节点数;
方式二,隐含层节点数s=sqrt(0.43mn+0.12mm+2.54n+0.35)+0.51,其中n为输入层节点数,m为输出节点数;所述输出节点数与预测步数相等。
所述步骤15中,所述动态变化学习效率方式具体是指,在初期使用较大学习速率进行模型优化,初期的学习速率为0.01-0.001,随着迭代次数的增加,学习速率逐步下降至初期学习速率的1/100。
学习速率逐步下降的方式为下述三种方式中的任意一种:
方式一,轮数减缓,即每N轮学习速率减半;
方式二,指数减缓,学习速率按训练轮数增长的指数差值递减,即 α=Aepoch_num·α0,其中α0是初始速率,epoch_num是训练轮数,A是衰减的底 数,α表示学习速率;
方式三,分数减缓,即
Figure RE-GDA0002948925720000032
其中decayrate是控制减缓 幅度参数,epoch_num是训练轮数。
所述步骤16具体是指,基于前序10个时间的特征预测未来某一时间的缺陷强度,将归一化的缺陷统计量作为循环神经网络的输入,用于学习缺陷序列的时序变化规律,再传入输出层做预测,最后将预测值逆归一化作为预测值。
具体计算流程如下:
1.计算重置门和更新门
重置门:
Figure 732026DEST_PATH_IMAGE017
更新门:
Figure 801613DEST_PATH_IMAGE018
其中
Figure 327273DEST_PATH_IMAGE019
为sigmoid函数,
Figure 812612DEST_PATH_IMAGE020
为上一时间的隐藏状态,
Figure 841748DEST_PATH_IMAGE021
为当前时间输入的接触网缺陷值,
Figure 347815DEST_PATH_IMAGE022
Figure 721290DEST_PATH_IMAGE023
Figure 134954DEST_PATH_IMAGE024
Figure 221859DEST_PATH_IMAGE025
为对应的权重参数,
Figure 570932DEST_PATH_IMAGE026
Figure 805604DEST_PATH_IMAGE027
是偏差参数。
2.计算候选隐藏状态
将重置门的输出和上一时间的隐藏状态做元素乘法,将元素乘法运算结果与当前输入连接,再通过
Figure 882013DEST_PATH_IMAGE028
(双曲正切)函数计算出候选状态:
Figure 89004DEST_PATH_IMAGE029
其中,
Figure 733611DEST_PATH_IMAGE030
Figure 330946DEST_PATH_IMAGE031
是权重参数,
Figure 86412DEST_PATH_IMAGE032
是偏差参数,
Figure 305166DEST_PATH_IMAGE033
是候选隐藏参数,
Figure 120676DEST_PATH_IMAGE034
表示按元素乘法。
3. 计算隐藏状态
t时间的隐藏状态使用当前时间的更新门对上一时间的隐藏状态和当前时间的候选隐藏状态的组合:
Figure 939727DEST_PATH_IMAGE035
4. 计算输出
由神经网络结构可知:
Figure 498884DEST_PATH_IMAGE036
其中,
Figure 414888DEST_PATH_IMAGE037
是预测值,
Figure 260353DEST_PATH_IMAGE038
是偏差参数,
Figure 956914DEST_PATH_IMAGE039
是权重参数。
输出数据逆归一化公式:
Figure 257445DEST_PATH_IMAGE040
其中
Figure DEST_PATH_IMAGE041
是逆归一化之后的缺陷预测值。
迭代优化
得到输出层后建立损失函数用于衡量输出值和真实值的差异,利用BPTT(随时间反向传播算法)最小化损失函数获得神经网络最终权重值。
步骤17中,是指剩余60%未用于训练过的样本数据。一般训练数据与测试数据4:1。迭代参数时,到使用时间顺序前80%数据训练,剩余20%做预测时停止。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,执行上述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
与现有技术相比,本发明所带来的有益的技术效果表现在:
1、由于实际中的时间序列具有大量非线性特征,传统的时间序列分析方法难以对其建立可靠稳定的预测模型。本发明将循环神经网络用于缺陷统计量的时间序列预测,通过GRU单元充分考虑到接触网缺陷统计序列的时间关联关系,能够准确学习缺陷统计量的时间变化规律。
2、本发明提出的结合接触网缺陷的基于GRU单元的循环神经网络模型结构简单,易搭建,适用于任何具有时间关联性的接触网缺陷预测业务。
附图说明
图1为本发明循环神经网络训练流程图;
图2为本发明使用GRU单元的RNN网络结构图。
具体实施方式
下面结合说明书附图,对本发明的技术方案作出进一步详细地阐述。
实施例1
本发明提出的方法,主要是为从根本上解决传统时间序列处理非线性时间序列的局限性。传统方法(如移动平均、指数平滑法等)都假定时间序列统计量符合线性关系,但信息的多层次和关联性使得时间序列呈现非常复杂的非线性。本发明通过循环神经网络提取接触网缺陷演变的时间规律,其中采用GRU(Gated Recurrent Unit,门控循环单元)作为隐藏层单元。不仅包括当前所见的输入样例,还包含之前时刻感受的信息,充分考虑时间序列的动态特性,进而获得更精准的接触网缺陷预测结果。
如图1所示,为本实施例的基本处理流程:
一种基于RNN的接触网故障趋势预测方法,包括以下步骤:
步骤一,采用接触网缺陷统计量样本序列训练用于接触网故障趋势预测的循环神经网络模型;
步骤二,输入接触网缺陷统计量实际序列至训练后的所述循环神经网路模型输入层,以所述循环神经网络的输出层数据作为接触网缺陷统计量趋势序列;
其中,步骤一包括:
步骤11,对接触网缺陷数据按预设周期进行划分统计,得到每预设周期的接触网缺陷数据原始统计量;对所述接触网缺陷数据原始统计量进行分布变换处理,构建用于训练循环神经网络的接触网缺陷统计量样本序列;
步骤12,按时间顺序从所述接触网缺陷统计量样本序列中选取部分数据作为所述循环神经网络的首次训练数据;
步骤13,根据接触网缺陷的分布复杂度确定所述循环神经网络隐藏层数量;例如:以接触网典型缺陷鸟害为例。隐藏层的目的是用于拟合非线性函数,一般来说,隐藏层数为2搭配适当的激活函数可以表示任意精度的任意决策边界,且可以拟合任意精度的平滑映射。隐藏层大于2可以学习复杂的描述。鸟害缺陷具有平稳性,此外具有季节性的周期特征,因此可设置隐藏层数量为3。若待预测缺陷具有更复杂的分布描述,可适当增加隐藏层数量;
步骤14,根据缺陷特征的时间相关性确定输入节点数;根据需要预测缺陷的步数确定输出节点数;根据柯尔莫格洛夫定理确定隐藏层神经元个数,或者根据接触网缺陷的样本数、样本噪声和样本规律的复杂程度确定隐藏层神经元个数,上述隐藏层神经元采用门控循环单元;例:以上述鸟害缺陷为例,隐藏层个数为3,认为下月鸟害缺陷数量与前三个月的数量密切相关,即输入为3,输出为1。若使用柯尔莫格洛夫定理,则隐藏节点数为7;使用经验公式则隐藏神经元数为4;
步骤15,采用动态变化学习效率方式对所述循环神经网络进行迭代优化;
步骤16,使用训练数据计算循环神经网络的各参数权重值,得到训练后的循环神经网络模型;
所述步骤二包括:
步骤21,对接触网缺陷统计量实际序列进行分布变换处理,并输入至训练后的循环神经网络模型;
步骤22,对所述循环神经网络的输出层数据做逆分布变换处理并将结果作为接触网缺陷统计量趋势序列。
步骤一还包括步骤17,即步骤16之后,若还有缺陷统计量数据未使用,则加入部分新数据重复步骤12至步骤16;若所有数据均已使用,则现有权重值为神经网络最终权重值,将神经网络最终权重值代入到神经网络模型中,进行接触网缺陷统计量趋势预测。步骤17中,是指剩余60%未用于训练过的样本数据。一般训练数据与测试数据4:1。迭代参数时,到使用时间顺序前80%数据训练,剩余20%做预测时停止。
所述步骤11中,构建训练样本数据:
典型的分布变换处理方式是归一化。采用min-max方法归一化待预测特征数据集(如导高)。M(t)为第t个样本数据,I(t)为第t个训练数据,转换公式为:
Figure 762376DEST_PATH_IMAGE001
。一个网络预测一类数据。不同数据类型需要不同的网络和参数。
所述步骤22中对所述循环神经网络的输出层数据做逆分布变换处理,具体 是指,若O(t)表示为逆归一化之后的缺陷预测值,o(t)表示为预测值,则逆分 布变换公式为:O(t)=o(t)*(max(M(t))-min(M(t)))+min(M(t))。
确定隐含层神经元数量和输入输出节点数:
输入输出节点数与实际问题高度相关。接触网时间预测模型中,循环神经网络设定一个输入节点,输出节点与预测步数相等。例如导高n步预测,则需设置n个输出节点。
隐含层GRU神经元数量可由以下方式确定:
方法1:柯尔莫格洛夫定理
隐含层节点数
Figure DEST_PATH_IMAGE045
,其中n为输入层节点数,接触网故障预测中,由于输入层节点数为1,故s=3;
方法2:经验公式
隐含层节点数s=sqrt(0.43mn+0.12mm+2.54n+0.35)+0.51,其中n为输入层节点数,m为输出节点数,可根据接触网缺陷预测步数确定,例如m=3,n=1,则s=3,计算结果取整数可得。其中n和m就是根据接触网缺陷特征确定的,隐藏节点数也就随着特征的变化而变化。
确定网络层数:
理论证明:具有偏差和一个隐含层与线性输出层的神经网络能够逼近任何有理函数。单个接触网缺陷预测神经网络的基础结构可考虑一个隐含层和一个输出层。
确定学习速率:
网络学习初期使用较大学习率进行模型优化,一般设置为0.01-0.001。随 着迭代的次数增加,学习率逐步下降至初始的1/100;
速率下降方式如下:
轮数减缓:每N轮学习率减半;
指数减缓,学习速率按训练轮数增长的指数差值递减,即α=Aepoch_num·α0, 其中α0是初始速率,epoch_num是训练轮数,A是衰减的底数,α表示学习速率;
分数减缓,即
Figure RE-GDA0002948925720000081
其中decayrate是控制减缓幅度参数,epoch_num是训练轮数。
计算网络权重
本发明考虑到接触网缺陷演变的时许特性,采用GRU(Gated Recurrent Unit)单元作为隐藏层单元,所述的模型基本结构包含一层循环神经网络,基于前序10个时间的特征预测未来某一个时间的缺陷强度,将归一化的缺陷统计量作为循环神经网络的输入,用于学习缺陷序列的时序变化规律,再传入输出层做预测,最后将预测值逆归一化作为预测值。具体计算流程如下:
1.计算重置门和更新门
重置门:
Figure 84663DEST_PATH_IMAGE017
更新门:
Figure 991308DEST_PATH_IMAGE018
其中
Figure 832225DEST_PATH_IMAGE019
为sigmoid函数,
Figure 637370DEST_PATH_IMAGE020
为上一时间的隐藏状态,
Figure 97301DEST_PATH_IMAGE021
为当前时间输入的接触网缺陷值,
Figure 733819DEST_PATH_IMAGE022
Figure 371736DEST_PATH_IMAGE023
Figure 398598DEST_PATH_IMAGE024
Figure 52433DEST_PATH_IMAGE025
为对应的权重参数,
Figure 153244DEST_PATH_IMAGE026
Figure 539226DEST_PATH_IMAGE027
是偏差参数。
2.计算候选隐藏状态
将重置门的输出和上一时间的隐藏状态做元素乘法,将元素乘法运算结果与当前输入连接,再通过
Figure 115701DEST_PATH_IMAGE028
(双曲正切)函数计算出候选状态:
Figure 432282DEST_PATH_IMAGE029
其中,
Figure 715496DEST_PATH_IMAGE030
Figure 600275DEST_PATH_IMAGE031
是权重参数,
Figure 273833DEST_PATH_IMAGE032
是偏差参数,
Figure 207154DEST_PATH_IMAGE033
是候选隐藏参数,
Figure 407191DEST_PATH_IMAGE034
表示按元素乘法。
3. 计算隐藏状态
t时间的隐藏状态使用当前时间的更新门对上一时间的隐藏状态和当前时间的候选隐藏状态的组合:
Figure 823391DEST_PATH_IMAGE035
计算输出:由神经网络结构可知:
Figure 312141DEST_PATH_IMAGE036
,其中,
Figure 580312DEST_PATH_IMAGE037
是预测值,
Figure 510221DEST_PATH_IMAGE038
是偏差参数,
Figure 736803DEST_PATH_IMAGE039
是权重参数;
输出数据逆归一化公式:
Figure 447270DEST_PATH_IMAGE040
其中
Figure 440503DEST_PATH_IMAGE041
是逆归一化之后的缺陷预测值。
迭代优化:得到输出层后建立损失函数用于衡量输出值和真实值的差异,利用BPTT最小化损失函数获得最优模型参数。
实施例2
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于循环神经网络的接触网故障预测方法的步骤。
在本实施例中处理器可以为中央处理器(Central Processing Unit,CPU)。处理器还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及单元,如本发明上述方法实施例中对应的程序单元。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及作品数据处理,即实现上述方法实施例中的方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个单元存储在所述存储器中,当被所述处理器执行时,执行上述实施例1中的方法。
实施例3
作为本发明又一较佳实施例,本实施例公开了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例1的步骤。

Claims (10)

1.一种基于RNN的接触网故障趋势预测方法,其特征在于,包括以下步骤:
步骤一,采用接触网缺陷统计量样本序列训练用于接触网故障趋势预测的循环神经网络模型;
步骤二,输入接触网缺陷统计量实际序列至训练后的所述循环神经网路模型输入层,以所述循环神经网络的输出层数据作为接触网缺陷统计量趋势序列;
其中,步骤一包括:
步骤11,对接触网缺陷数据按预设周期进行划分统计,得到每预设周期的接触网缺陷数据原始统计量;对所述接触网缺陷数据原始统计量进行分布变换处理,构建用于训练循环神经网络的接触网缺陷统计量样本序列;
步骤12,按时间顺序从所述接触网缺陷统计量样本序列中选取部分数据作为所述循环神经网络的首次训练数据;
步骤13,根据接触网缺陷的分布复杂度确定所述循环神经网络隐藏层数量;
步骤14,根据缺陷特征的时间相关性确定输入节点数;根据需要预测缺陷的步数确定输出节点数;根据柯尔莫格洛夫定理确定隐藏层神经元个数,或者根据接触网缺陷的样本数、样本噪声和样本规律的复杂程度确定隐藏层神经元个数,上述隐藏层神经元采用门控循环单元;
步骤15,采用动态变化学习效率方式对所述循环神经网络进行迭代优化;
步骤16,使用训练数据计算循环神经网络的各参数权重值,得到训练后的循环神经网络模型;
所述步骤二包括:
步骤21,对接触网缺陷统计量实际序列进行分布变换处理,并输入至训练后的循环神经网络模型;
步骤22,对所述循环神经网络的输出层数据做逆分布变换处理并将结果作为接触网缺陷统计量趋势序列。
2.如权利要求1所述的一种基于RNN的接触网故障趋势预测方法,其特征在于:步骤一还包括步骤17,即步骤16之后,若还有缺陷统计量数据未使用,则加入部分新数据重复步骤12至步骤16;若所有数据均已使用,则现有权重值为神经网络最终权重值,将神经网络最终权重值代入到神经网络模型中,进行接触网缺陷统计量趋势预测。
3.如权利要求1或2所述的一种基于RNN的接触网故障趋势预测方法,其特征在于:所述步骤11中,对所述接触网缺陷数据原始统计量进行分布变换处理,具体是指,采用min-max方法归一化待预测特征数据集;若M(t)为第t个样本数据,I(t)为第t个训练数据,则转换公式为:
Figure DEST_PATH_IMAGE001
所述步骤22中对所述循环神经网络的输出层数据做逆分布变换处理,具体是指,若O(t)表示为逆归一化之后的缺陷预测值,o(t)表示为预测值,则逆分布变换公式为:
Figure DEST_PATH_IMAGE003
4.如权利要求1或2所述的一种基于RNN的接触网故障趋势预测方法,其特征在于:所述步骤12中,按时间顺序从所述接触网缺陷统计量样本序列中选取40%数据作为所述循环神经网络的首次训练数据。
5.如权利要求1所述的一种基于RNN的接触网故障趋势预测方法,其特征在于:所述步骤14中,隐藏神经元的个数由以下两种方式中的任意一种确定;
方式一,隐含层节点数s=2n+1,其中n为输入层节点数;
方式二,隐含层节点数s=sqrt(0.43mn+0.12mm+2.54n+0.35)+0.51,其中n为输入层节点数,m为输出节点数;所述输出节点数与预测步数相等。
6.如权利要求1所述的一种基于RNN的接触网故障趋势预测方法,其特征在于:所述步骤15中,所述动态变化学习效率方式具体是指,在初期使用较大学习速率进行模型优化,初期的学习速率为0.01-0.001,随着迭代次数的增加,学习速率逐步下降至初期学习速率的1/100;
学习速率逐步下降的方式为下述三种方式中的任意一种:
方式一,轮数减缓,即每N轮学习速率减半;
方式二,指数减缓,学习速率按训练轮数增长的指数差值递减,即
Figure DEST_PATH_IMAGE005
,其中
Figure DEST_PATH_IMAGE007
是初始速率,
Figure DEST_PATH_IMAGE009
是训练轮数,A是衰减的底数,
Figure DEST_PATH_IMAGE011
表示学习速率;
方式三,分数减缓,即
Figure DEST_PATH_IMAGE013
,其中
Figure DEST_PATH_IMAGE015
是控制减缓幅度参数,
Figure 676418DEST_PATH_IMAGE009
是训练轮数。
7.如权利要求1所述的一种基于RNN的接触网故障趋势预测方法,其特征在于:所述步骤16具体是指,基于前序10个时间的特征预测未来某一时间的缺陷强度,将归一化的缺陷统计量作为循环神经网络的输入,用于学习缺陷序列的时序变化规律,再传入输出层做预测,最后将预测值逆归一化作为预测值。
8. 如权利要求7所述的一种基于RNN的接触网故障趋势预测方法,其特征在于:具体计算流程如下:
步骤161,计算重置门和更新门
重置门:
Figure DEST_PATH_IMAGE016
更新门:
Figure DEST_PATH_IMAGE017
其中
Figure DEST_PATH_IMAGE018
为sigmoid函数,
Figure DEST_PATH_IMAGE019
为上一时间的隐藏状态,
Figure DEST_PATH_IMAGE020
为当前时间输入的接触网缺陷值,
Figure DEST_PATH_IMAGE021
Figure DEST_PATH_IMAGE022
Figure DEST_PATH_IMAGE023
Figure DEST_PATH_IMAGE024
为对应的权重参数,
Figure DEST_PATH_IMAGE025
Figure DEST_PATH_IMAGE026
是偏差参数;
步骤162,计算候选隐藏状态,将重置门的输出和上一时间的隐藏状态做元素乘法,将元素乘法运算结果与当前输入连接,再通过
Figure DEST_PATH_IMAGE027
双曲正切函数计算出候选状态:
Figure DEST_PATH_IMAGE028
其中,
Figure DEST_PATH_IMAGE029
Figure DEST_PATH_IMAGE030
是权重参数,
Figure DEST_PATH_IMAGE031
是偏差参数,
Figure DEST_PATH_IMAGE032
是候选隐藏参数,
Figure DEST_PATH_IMAGE033
表示按元素乘法;
步骤163, 计算隐藏状态,t时间的隐藏状态使用当前时间的更新门对上一时间的隐藏状态和当前时间的候选隐藏状态的组合:
Figure DEST_PATH_IMAGE034
步骤164,计算输出,由神经网络结构可知:
Figure DEST_PATH_IMAGE035
,其中,
Figure DEST_PATH_IMAGE036
是预测值,
Figure DEST_PATH_IMAGE037
是偏差参数,
Figure DEST_PATH_IMAGE038
是权重参数;输出数据逆归一化公式:
Figure DEST_PATH_IMAGE039
其中
Figure DEST_PATH_IMAGE040
是逆归一化之后的缺陷预测值;
步骤165,迭代优化,得到输出层后建立损失函数用于衡量输出值和真实值的差异,利用BPTT最小化损失函数获得神经网络最终权重值。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,执行上述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
CN202011324024.4A 2020-11-23 2020-11-23 一种基于rnn的接触网故障趋势预测方法、设备及存储介质 Active CN112633550B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011324024.4A CN112633550B (zh) 2020-11-23 2020-11-23 一种基于rnn的接触网故障趋势预测方法、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011324024.4A CN112633550B (zh) 2020-11-23 2020-11-23 一种基于rnn的接触网故障趋势预测方法、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112633550A true CN112633550A (zh) 2021-04-09
CN112633550B CN112633550B (zh) 2023-07-18

Family

ID=75303761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011324024.4A Active CN112633550B (zh) 2020-11-23 2020-11-23 一种基于rnn的接触网故障趋势预测方法、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112633550B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114816997A (zh) * 2022-03-29 2022-07-29 湖北大学 一种基于图神经网络与双向gru特征抽取的缺陷预测方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5408424A (en) * 1993-05-28 1995-04-18 Lo; James T. Optimal filtering by recurrent neural networks
CN109308522A (zh) * 2018-09-03 2019-02-05 河海大学常州校区 一种基于循环神经网络的gis故障预测方法
CN109522600A (zh) * 2018-10-16 2019-03-26 浙江大学 基于组合深度神经网络的复杂装备剩余使用寿命预测方法
CN109753872A (zh) * 2018-11-22 2019-05-14 四川大学 强化学习单元匹配循环神经网络系统及其训练和预测方法
CN109765333A (zh) * 2018-12-05 2019-05-17 国网辽宁省电力有限公司信息通信分公司 一种基于GoogleNet模型的变压器故障诊断方法
US20200133489A1 (en) * 2018-10-31 2020-04-30 EMC IP Holding Company LLC I/o behavior prediction based on long-term pattern recognition
CN111242463A (zh) * 2020-01-08 2020-06-05 天津凯发电气股份有限公司 一种基于bp神经网络的at单线供电系统的故障测距方法
CN111523081A (zh) * 2020-05-01 2020-08-11 西北工业大学 一种基于增强门控循环神经网络的航空发动机故障诊断方法
CN111552609A (zh) * 2020-04-12 2020-08-18 西安电子科技大学 一种异常状态检测方法、系统、存储介质、程序、服务器
CN111855810A (zh) * 2020-07-20 2020-10-30 济南大学 一种基于循环神经网络的轨底伤损识别方法及系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5408424A (en) * 1993-05-28 1995-04-18 Lo; James T. Optimal filtering by recurrent neural networks
CN109308522A (zh) * 2018-09-03 2019-02-05 河海大学常州校区 一种基于循环神经网络的gis故障预测方法
CN109522600A (zh) * 2018-10-16 2019-03-26 浙江大学 基于组合深度神经网络的复杂装备剩余使用寿命预测方法
US20200133489A1 (en) * 2018-10-31 2020-04-30 EMC IP Holding Company LLC I/o behavior prediction based on long-term pattern recognition
CN109753872A (zh) * 2018-11-22 2019-05-14 四川大学 强化学习单元匹配循环神经网络系统及其训练和预测方法
CN109765333A (zh) * 2018-12-05 2019-05-17 国网辽宁省电力有限公司信息通信分公司 一种基于GoogleNet模型的变压器故障诊断方法
CN111242463A (zh) * 2020-01-08 2020-06-05 天津凯发电气股份有限公司 一种基于bp神经网络的at单线供电系统的故障测距方法
CN111552609A (zh) * 2020-04-12 2020-08-18 西安电子科技大学 一种异常状态检测方法、系统、存储介质、程序、服务器
CN111523081A (zh) * 2020-05-01 2020-08-11 西北工业大学 一种基于增强门控循环神经网络的航空发动机故障诊断方法
CN111855810A (zh) * 2020-07-20 2020-10-30 济南大学 一种基于循环神经网络的轨底伤损识别方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陆航;杨涛存;刘洋;于卫东;田光荣;肖齐;李方?;: "基于LSTM的动车组故障率预测模型", 中国铁路 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114816997A (zh) * 2022-03-29 2022-07-29 湖北大学 一种基于图神经网络与双向gru特征抽取的缺陷预测方法
CN114816997B (zh) * 2022-03-29 2023-08-18 湖北大学 一种基于图神经网络与双向gru特征抽取的缺陷预测方法

Also Published As

Publication number Publication date
CN112633550B (zh) 2023-07-18

Similar Documents

Publication Publication Date Title
US11409347B2 (en) Method, system and storage medium for predicting power load probability density based on deep learning
CN107590565B (zh) 一种构建建筑能耗预测模型的方法及装置
Xie et al. Time series prediction based on NARX neural networks: An advanced approach
Wang et al. Hydrological time series forecast model based on wavelet de-noising and ARIMA-LSTM
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
CN107977710B (zh) 用电异常数据检测方法和装置
CN110851782A (zh) 一种基于轻量级时空深度学习模型的网络流量预测方法
CN110909926A (zh) 基于tcn-lstm的太阳能光伏发电预测方法
CN114422381A (zh) 通信网络流量预测方法、系统、存储介质及计算机设备
Kurbatskii et al. On the neural network approach for forecasting of nonstationary time series on the basis of the Hilbert-Huang transform
CN112468326A (zh) 基于时间卷积神经网络的访问流量预测方法
Barzola-Monteses et al. Energy consumption of a building by using long short-term memory network: a forecasting study
CN115308558B (zh) Cmos器件寿命预测方法、装置、电子设备及介质
CN110879927A (zh) 一种用于海目标检测的海杂波幅度统计分布现场建模方法
CN111310963A (zh) 电站的发电数据预测方法、装置、计算机设备和存储介质
Vafakhah et al. Application of intelligent technology in rainfall analysis
Tian et al. A hybrid time-delay prediction method for networked control system
CN112633550A (zh) 一种基于rnn的接触网故障趋势预测方法、设备及存储介质
CN113919221A (zh) 一种基于bp神经网络的风机载荷预测及分析方法、装置及存储介质
Zhao et al. NTAM-LSTM models of network traffic prediction
CN117596191A (zh) 一种电力物联网异常检测方法、装置及存储介质
US20190042681A1 (en) Method and apparatus for selecting integrated circuit device neural network modeling sample
CN115907000A (zh) 一种用于电力系统最优潮流预测的小样本学习方法
CN111916049B (zh) 一种语音合成方法及装置
CN112561180B (zh) 基于元学习的短期风速预测方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant