CN114298413A - 一种水电机组振摆趋势预测方法 - Google Patents
一种水电机组振摆趋势预测方法 Download PDFInfo
- Publication number
- CN114298413A CN114298413A CN202111631550.XA CN202111631550A CN114298413A CN 114298413 A CN114298413 A CN 114298413A CN 202111631550 A CN202111631550 A CN 202111631550A CN 114298413 A CN114298413 A CN 114298413A
- Authority
- CN
- China
- Prior art keywords
- parameters
- parameter
- data set
- input
- predicted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000011176 pooling Methods 0.000 claims abstract description 26
- 238000012544 monitoring process Methods 0.000 claims abstract description 13
- 238000012216 screening Methods 0.000 claims abstract description 6
- 239000013598 vector Substances 0.000 claims description 58
- 230000007774 longterm Effects 0.000 claims description 30
- 230000006403 short-term memory Effects 0.000 claims description 26
- 230000007787 long-term memory Effects 0.000 claims description 23
- 230000006870 function Effects 0.000 claims description 20
- 230000007246 mechanism Effects 0.000 claims description 19
- 210000004027 cell Anatomy 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 16
- 230000010355 oscillation Effects 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 13
- 238000012795 verification Methods 0.000 claims description 10
- 230000015654 memory Effects 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 6
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims description 4
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 210000002569 neuron Anatomy 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 claims description 3
- 125000004432 carbon atom Chemical group C* 0.000 claims description 3
- 230000014759 maintenance of location Effects 0.000 claims description 3
- 238000011425 standardization method Methods 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 2
- 230000007547 defect Effects 0.000 abstract description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000010219 correlation analysis Methods 0.000 abstract description 2
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012821 model calculation Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种水电机组振摆趋势预测方法,包括步骤:获取水电机组振摆监测数据的样本数据集,分析振摆监测数据,绘制待预测振动参量或摆度参量和其他相关参数的关系坐标图,确定候选特征参量;建立CMI‑SAL预测模型;通过条件互信息法模块筛选机组关键设备振摆相关工况参数。本发明的有益效果是:本发明运用条件互信息相关分析方法筛选输入特征,能够对两个及以上的振摆变量进行分析,判断变量之间的关联性和相关性,在互信息法基础上解决了过冗余缺点,提高预测效率;运用滑动窗口和最大池化法,采用卷积层能够缩小输入数据的数量级规模,在输入特征中提取局部最大值,降低可训练参数数目,提高数据鲁棒性和模型的运算速度。
Description
技术领域
本发明属于水电站安全状态检测及时序预测领域,尤其涉及一种基于条件互信息法、自注意力机制、长短期记忆网络的水电机组振摆预测方法。
背景技术
水力发电机组(hydro-generating unit,HGU)是水电站发电的重要设备,其安全稳定运行与水电站正常运转密切相关。随着HGU结构日益复杂,单机容量和比转速逐步提高,对保障水力发电机组的安全运行提出了更高的要求。状态检修时,通过反映设备状态的属性和运行的历史时间序列数据,预测机组未来时刻的运行状态发展趋势,提前预警潜在故障,及时制定有效方案,避免不必要的停机检修以及重大事故造成的人力和经济损失。
在水电机组运行中,振摆故障是最常见的故障类型。由水轮机组的结构可知,水轮机组主要由旋转部和固定部两部分组成。因此在发电机运行过程中发生异常时会导致机组出现振动和摆动。机组振摆波动受多种因素影响,水电机组趋势预测的输入参数是影响预测结果准确度的重要因素,并非所有的相关特征都能提供有效信息,因此需要进行特征评价以选出列举指标中相关度最高的几组特征。现有的状态监测系统多数未考虑其他状态参数影响,单纯基于工况的经验值报警。另外,振摆序列非线性和波动性很强,预测难度大,现有振摆趋势预测模型存在长期依赖问题、梯度消失等问题,且未考虑各变量时间序列的关系。因此建立基于分析状态参数间映射关系且预测精度高的水电机组振摆趋势预测模型尤为重要。
基于深度学习算法的预测模型相比于其他传统预测模型精确度更高,是日后发展的趋势。目前比较常见的深度学习模型为卷积神经网络、循环神经网络等,但是由于水电站电机组数据的复杂性较大,基于深度学习算法的预测模型至今仍没有完全解决预测精度的问题。
发明内容
本发明的目的是克服现有技术中的不足,提供一种水电机组振摆趋势预测方法。
这种水电机组振摆趋势预测方法,包括以下步骤:
步骤1、获取水电机组振摆监测数据的样本数据集,分析振摆监测数据,绘制待预测振动参量或摆度参量和其他相关参数的关系坐标图,确定候选特征参量;
步骤2、建立CMI-SAL预测模型,CMI-SAL模型包括条件互信息法模块、卷积层、长短期记忆网络层(LSTM)和自注意力机制;
步骤3、通过条件互信息法模块筛选机组关键设备振摆相关工况参数;对工况参数进行整理并提取,形成最终输入数据集和输出数据集;
步骤4、采取z-score标准化方法对输入数据集和输出数据集的数据进行标准化处理,剔除异常值;
上式中,xi表示原始序列,x′i表示标准化后的序列;μi表示序列的平均值,σi表示序列的标准差;输入数据集中的候选特征参量和输出数据集中对应的待预测主参量形成序列;
步骤5、基于卷积层处理标准化后的输入数据集和输出数据集中的数据;引入滑动窗口机制和最大池化法提取其中一类候选特征参量,并缩减数据量,减少模型计算量;
步骤6、基于长短期记忆网络层处理经过步骤5中基于卷积层处理的水电机组输入数据集和输出数据集,捕获水电机组各输入数据集中的长期依赖关系特征;
步骤7、将输入时序长期依赖关系的特征向量基于自注意力机制,运用缩放点乘模块计算多头注意力的新的权重表示;通过多头注意力将每个变量时间序列分别和其他变量时序特征相关联,并加权得到一个新向量表示;自注意力机制获取了数据之间的关联性,在水电机组振摆趋势预测问题中,由于不同参量各个时刻的数值具有强相关性,从而导致不同状态属性序列存在较大关联;
步骤8、使用步骤3得到的输入数据集和输出数据集对CMI-SAL预测模型进行训练,输出振摆预测序列,并用预测集进行预测验证;
步骤9、将待预测振动参量或摆度参量输入训练好的CMI-SAL预测模型中,得到预测结果,并计算预测评估指标。
作为优选,步骤1中振摆监测数据包括振动参量、摆度参量和其他相关参数,通过分析样本数据集中振动参量、摆度参量和其他相关参数的关系,来绘制待预测振动参量或摆度参量和其他相关参数的关系坐标图;步骤1中其他相关参数包括基于相关机理和经验分析后得到的工况参量,工况参量包括水头、功率和温度;步骤3中待预测主参量为待预测振动参量或摆度参量;步骤6中长短期记忆网络层的超参数设置方式为:设定初始值后,每隔1次训练,打印当前准确率,使用步骤3得到的输入数据集和输出数据集的前80%作为训练集,后20%作为验证集,衡量长短期记忆网络层的性能,一旦准确率上升或损失函数值下降,则微调超参数提升性能。
作为优选,步骤3具体包括如下步骤:
步骤3.1、首先选取待预测主参量集合X={x1,x2,...xm},其余各参量形成候选特征参量集合Y={y1,y2,...yn},其中xm为待预测主参量,m为待预测主参量的个数;yn为候选特征参量,n为候选特征参量的个数;
步骤3.2、通过CMI-SAL预测模型计算集合Y中所有候选特征参量与待预测主参量集合X中所有待预测主参量的互信息值I(X;Y);选取互信息值最大的参量,将互信息值最大的参量作为选取的输入参量之一,并从Y中剔除该参量;互信息值I(X;Y)的计算方式为:
待预测主参量xm和候选特征参量yn形成概率密度指数据集F={(xm,yn),m=1,2,...i,n=1,2,...k},其中i为待预测主参量xm的个数,k为候选特征参量yn的个数;垂直于坐标系的横轴和纵轴,将坐标系划分为x×y个网格A;采用CMI-SAL预测模型来计算集合Y中所有候选特征参量与待预测主参量集合X中所有待预测主参量的互信息值I(X;Y),I(X;Y)为概率密度指数据集F中任意一点落在网格中的概率:
上式中,ρ(x,y)表示联合概率密度,联合概率密度为数据集F中落在其中一个网格内的点占F中全部点的比例,ρ(x)、ρ(y)均为边缘概率密度,其中ρ(x)表示待预测主参量集合X中落在其中一个网格内的点占X中全部点的比例,ρ(y)表示候选特征参量集合Y中落在其中一个网格内的点占Y中全部点的比例;
步骤3.3、假设Z为已知条件,在剔除已选参量条件Z情况下,采用CMI-SAL预测模型来计算集合Y中剩余候选特征参量与待预测主参量集合X中所有待预测主参量的条件互信息值:
上式中,p(z)为已知条件Z下的边缘概率密度,p(x,y|z)为已知条件Z下X、Y的联合概率密度函数,p(x|z)和p(y|z)分别为已知条件Z下X和Y的概率密度函数;
步骤3.4、对步骤3.3计算得到的条件互信息值I(X;Y|Z)按大小进行排列,剔除I(X;Y|Z)值趋近于0的条件互信息值对应的候选特征参量与待预测主参量;将剩余候选特征参量与待预测主参量作为机组关键设备振摆相关工况参数;
步骤3.5、将通过条件互信息法筛选出的机组关键设备振摆相关工况参数进行整理并提取,形成最终输入数据集和输出数据集;输入数据集为设定时间段内,以一定时间为间隔的水电机组振摆基础参数候选特征参量数据;输出数据集是滞后于输入数据集设定时期的水电机组振摆基础参数待预测主参量数据。
作为优选,步骤5具体包括如下步骤:
步骤5.1、基于卷积层对标准化后的输入数据集和输出数据集中的数据进行最大池化处理,降低输出数据的维度,同时保留输入数据的最重要特征信息:
步骤5.2、假设原始振摆时间序列长度为T,设置最大池化算子大小a以及滑动窗口大小b和窗口数量c,将数据长度缩减为最大池化法是常见的池化法,即取局部接受域中值最大的点;最大池化过程可以从输入特征中提取局部最大值,以减少可训练参数的数量,提高模型的鲁棒性。
作为优选,步骤6具体包括如下步骤:
步骤6.1、设多元时序为:
X={(x1,x2,x3,...xn)1,(x1,x2,x3,...xn)2,...(x1,x2,x3,...xn)T}
上式中,(x1,x2,x3,...xn)表示输入向量,n表示特征数,T表示输入的时序长度,所有时序变量在时刻l的输入为Xl;
步骤6.2、将多变量序列(X1,X2,...XT)进行递归计算,输出序列向量为h1,h2,…,hT,h1,h2,…,hT表示输入时序长期依赖关系的特征向量,每一个序列向量的长度均为c;将长短期记忆网络层的隐含层维度大小设置为d,则hT是长度为d的隐含层变量;隐含层变量通过全连接层处理,得到d×(c+d)的向量hT;向量hT的数据大小为j为4的整数倍。
作为优选,在步骤6中:
长短期记忆网络层的隐含层添加三个控制门,以保存长期记忆状态,这可以大大提高预测精确度;三个控制门分别为输入门、遗忘门和输出门;长短期记忆网络层通过输入门、遗忘门和输出门学习并调整水电机组各输入数据集内各数据之间的权重,使得CMI-SAL预测模型达到最优化;输入门决定待更新的输入值;通过遗忘门决定从细胞状态中丢弃的信息,1表示完全保留,0表示完全舍弃;确定哪些新信息被存放在状态细胞中,然后更新细胞状态;输出门最后输出水电机组各输入数据集内各数据之间的权重;计算公式如下:
it=σ(Wi·[ht-1,xt]+bi)
ft=σ(Wf·[ht-1,xt]+bf)
Ot=σ(WO·[ht-1,xt]+bO)
ht=Ot*tanh(Ct)
上式中,it、ft、Ct、Ot、ht分别为输入门、遗忘门、状态节点、记忆细胞、输出门和隐藏层的输出;xt为t时刻的输入值,Ct为t时刻的细胞状态,ht为t时刻的输出值,为候选值;Wi、Wf、WC、WO分别为输入门、遗忘门、状态细胞、输出门权重矩阵;bi、bf、bC、bO分别为输入门、遗忘门、状态细胞、输出门的偏置项;
长短期记忆网络层的激活函数为ReLU函数(修正线性单元):
上式中,x为输入值。
作为优选,步骤7中,假设缩放点乘模块运用4次缩放点乘运算,则每次缩放点乘的每个输入的维度大小为每组权重大小为每次缩放点乘后的结果为si,最终将4次缩放点乘后的结果运用concatenate函数合并,得到s1,s2,s3,s4。
作为优选,步骤7具体包括如下步骤:
步骤7.1、运用缩放点乘模块计算多头注意力的新的权重表示:
步骤7.2、Q、K和V都是原始输入时序长期依赖关系的特征向量经过三个线性投影得到的向量矩阵,其计算关系为:
上式中,Wq、Wk和Wv分别为Q、K和V的矩阵权重参数。
作为优选,步骤8具体包括如下步骤:
步骤8.1、使用步骤3.5得到的输入数据集对CMI-SAL预测模型进行训练,CMI-SAL预测模型首先通过长短期记忆网络层得到捕获输入时间序列长期依赖关系的特征向量hT;
步骤8.2、再通过长短期记忆网络层内的全连接层以及自注意力机制得到每个特征向量hT的新的加权向量,新的加权向量中每一行分别代表g1,g2,g3…gT,大小为j;
步骤8.3、把时间序列长期依赖关系的特征向量hT和每个特征变量的新向量用concatenate函数合并表示成[g1,hT],[g2,hT],[g3,hT],...[g(n-b+1)/a,hT],通过全连接层得到预测标量,输出预测标量作为振摆预测序列;
步骤8.4、使用步骤3.5得到的输出数据集进行预测验证。
作为优选,步骤9中预测评估指标包括平均绝对误差MAE、平均绝对百分比误差MAPE和均方根误差RMSE:
本发明的有益效果是:
由于水电机组振摆数据具有数据量大,非线性和波动性强的特征,因此本发明运用条件互信息相关分析方法筛选输入特征,能够对两个及以上的振摆变量进行分析,判断变量之间的关联性和相关性,在互信息法基础上解决了过冗余缺点,提高预测效率;运用滑动窗口和最大池化法,采用卷积层能够缩小输入数据的数量级规模,在输入特征中提取局部最大值,降低可训练参数数目,提高数据鲁棒性和模型的运算速度;
本发明运用长短期记忆网络(LSTM层)捕获数据之间的长期依赖关系,可以很好地解决神经网络梯度消失问题,从而改善长期依赖,储存较早的历史信息;在神经网络中引入了ReLU函数,使得一部分神经元输出为0,能够提高网络稀疏性,并且减少了参数的相互依存关系,避免发生过拟合现象;运用自注意力机制获取各变量时序之间的关联性,对不同参量各个时刻的数值进行权值筛选,以此提高预测精度;本发明是针对长期水电机组振摆预测的合适方法。
附图说明
图1为本发明水电机组振摆趋势预测方法流程图;
图2为本发明自注意力机制的工作原理图;
图3为长短期记忆网络的隐含层结构示意图。
具体实施方式
下面结合实施例对本发明做进一步描述。下述实施例的说明只是用于帮助理解本发明。应当指出,对于本技术领域的普通人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
实施例一
本申请实施例一提供了一种如图1所示水电机组振摆趋势预测方法,包括步骤:
(1)分析振摆监测数据
绘制待预测振动或摆度参量和其他相关参数的关系坐标图,确定候选特征参量;
(2)条件互信息法筛选机组关键设备振摆相关工况参数
首先选取一个预测主参量X,其余各参量为候选特征量集合Y={y1,y2,...yn},其中,yn为特征量,n为特征量个数。根据公式计算Y中所有参量和X的互信息值I(X;Y);然后,选取互信息值最大的参量,该参量作为选取的输入参量之一,并从Y中剔除该参量;接着,在剔除已选参量条件Z情况下,计算剩余候选参量与X的条件互信息值I(X;Y|Z);最后,对条件互信息值按大小进行排列,剔除值趋近于0的参量,最终确定输入特征参量;
(3)数据标准化
对数据进行预处理,剔除异常值,用z-score法标准化数据;
(4)基于卷积层处理数据
(5)基于LSTM处理水电机组数据
将卷积层处理后的数据运用LSTM网络进行处理,可以捕获水电机组各输入属性序列中的长期依赖关系特征,LSTM隐含层结构如图2所示。设多元时序X={(x1,x2,x3,…xn)1,(x1,x2,x3,…xn)2,...(x1,x2,x3,…xn)T},其中(x1,x2,x3,...xn)表示输入向量,n表示特征数,T表示输入的时序长度,所有时序变量在时刻1的输入为X1,将多变量序列(X1,X2,...XT)递归计算,输出序列向量为h1,h2,…,hT,该序列表示捕获输入时序长期依赖关系的特征向量,每一个序列向量的长度均为c。隐含层维度大小设置为d,即hT是长度为d的隐含层变量。之间通过一个全连接层,变成d×(c+d)的向量hT;
(6)基于自注意力机制处理水电机组数据
将之前经过卷积层处理后的数据先经过全连接层处理成大小为的数据,j可被4整除,然后再经过自注意力机制处理。前文提到的自注意力机制在于运用缩放点乘模块计算多头注意力的新的权重表示。假设运用4次缩放点乘运算,则每次缩放点乘的每个输入的维度大小为每组权重大小为每次缩放点乘后的结果为si,最终将4次结果运用concatenate函数合并得到s1,s2,s3,s4。多头注意力可以把每个变量时间序列分别和其他变量时序的特征相关联,并加权得到一个新向量表示。
(7)输出振摆预测序列
模型首先通过LSTM层得到捕获输入时间序列长期依赖关系的特征向量hT,另外再通过全连接层以及自注意力机制得到每个变量新的加权向量,每一行分别代表g1,g2,g3...gT,大小为j。把长期依赖关系特征和每个变量的新向量用一个concatenate函数合并表示成[g1,hT],[g2,hT],[g3,hT],...[g(n-b+1)/a,hT],然后通过全连接层得到预测标量。对于设置神经网络超参数,设定初始值后可每隔1次训练过程打印当前准确率,使用验证集衡量网络的性能,一旦准确率上升或loss下降可通过微调超参数提升性能。
实施例二
在实施例一的基础上,本申请实施例二提供了一种水电机组振摆趋势预测方法的具体实现方式:
步骤1、获取水电机组振摆监测数据的样本数据集,分析振摆监测数据,绘制待预测振动参量或摆度参量和其他相关参数的关系坐标图,确定候选特征参量;振摆监测数据包括振动参量、摆度参量和其他相关参数,通过分析样本数据集中振动参量、摆度参量和其他相关参数的关系,来绘制待预测振动参量或摆度参量和其他相关参数的关系坐标图;
步骤2、建立CMI-SAL预测模型,CMI-SAL模型包括条件互信息法模块、卷积层、长短期记忆网络层(LSTM)和自注意力机制;
步骤3、通过条件互信息法模块筛选机组关键设备振摆相关工况参数;待预测主参量为待预测振动参量或摆度参量;
步骤3.1、首先选取待预测主参量集合X={x1,x2,...xm},其余各参量形成候选特征参量集合Y={y1,y2,...yn},其中xm为待预测主参量,m为待预测主参量的个数;yn为候选特征参量,n为候选特征参量的个数;
步骤3.2、通过CMI-SAL预测模型计算集合Y中所有候选特征参量与待预测主参量集合X中所有待预测主参量的互信息值I(X;Y);选取互信息值最大的参量,将互信息值最大的参量作为选取的输入参量之一,并从Y中剔除该参量;互信息值I(X;Y)的计算方式为:
待预测主参量xm和候选特征参量yn形成概率密度指数据集F={(xm,yn),m=1,2,...i,n=1,2,...k},其中i为待预测主参量xm的个数,k为候选特征参量yn的个数;垂直于坐标系的横轴和纵轴,将坐标系划分为x×y个网格A;采用CMI-SAL预测模型来计算集合Y中所有候选特征参量与待预测主参量集合X中所有待预测主参量的互信息值I(X;Y),I(X;Y)为概率密度指数据集F中任意一点落在网格中的概率:
上式中,ρ(x,y)表示联合概率密度,联合概率密度为数据集F中落在其中一个网格内的点占F中全部点的比例,ρ(x)、ρ(y)均为边缘概率密度,其中ρ(x)表示待预测主参量集合X中落在其中一个网格内的点占X中全部点的比例,ρ(y)表示候选特征参量集合Y中落在其中一个网格内的点占Y中全部点的比例;
步骤3.3、假设Z为已知条件,在剔除已选参量条件Z情况下,采用CMI-SAL预测模型来计算集合Y中剩余候选特征参量与待预测主参量集合X中所有待预测主参量的条件互信息值:
上式中,p(z)为已知条件Z下的边缘概率密度,p(x,y|z)为已知条件Z下X、Y的联合概率密度函数,p(x|z)和p(y|z)分别为已知条件Z下X和Y的概率密度函数;
步骤3.4、对步骤3.3计算得到的条件互信息值I(X;Y|Z)按大小进行排列,剔除I(X;Y|Z)值趋近于0的条件互信息值对应的候选特征参量与待预测主参量;将剩余候选特征参量与待预测主参量作为机组关键设备振摆相关工况参数;
步骤3.5、将通过条件互信息法筛选出的机组关键设备振摆相关工况参数进行整理并提取,形成最终输入数据集和输出数据集;输入数据集为设定时间段内,以一定时间为间隔的水电机组振摆基础参数候选特征参量数据;输出数据集是滞后于输入数据集设定时期的水电机组振摆基础参数待预测主参量数据;
步骤4、采取z-score标准化方法对输入数据集和输出数据集的数据进行标准化处理,剔除异常值;
上式中,xi表示原始序列,xi'表示标准化后的序列;μi表示序列的平均值,σi表示序列的标准差;输入数据集中的候选特征参量和输出数据集中对应的待预测主参量形成序列;
假设缩放点乘模块运用4次缩放点乘运算,则每次缩放点乘的每个输入的维度大小为每组权重大小为每次缩放点乘后的结果为si,最终将4次缩放点乘后的结果运用concatenate函数合并,得到s1,s2,s3,s4;
步骤5、基于卷积层处理标准化后的输入数据集和输出数据集中的数据;引入滑动窗口机制和最大池化法提取其中一类候选特征参量,并缩减数据量,减少模型计算量;
步骤5.1、基于卷积层对标准化后的输入数据集和输出数据集中的数据进行最大池化处理,降低输出数据的维度,同时保留输入数据的最重要特征信息:
步骤5.2、假设原始振摆时间序列长度为T,设置最大池化算子大小a以及滑动窗口大小b和窗口数量c,将数据长度缩减为最大池化法是常见的池化法,即取局部接受域中值最大的点;最大池化过程可以从输入特征中提取局部最大值,以减少可训练参数的数量,提高模型的鲁棒性;
步骤6、基于长短期记忆网络层处理经过步骤5中基于卷积层处理的水电机组输入数据集和输出数据集,捕获水电机组各输入数据集中的长期依赖关系特征;长短期记忆网络层的超参数设置方式为:设定初始值后,每隔1次训练,打印当前准确率,使用验证集衡量长短期记忆网络层的性能,一旦准确率上升或损失函数值下降,则微调超参数提升性能;
步骤6.1、设多元时序为:
X={(x1,x2,x3,...xn)1,(x1,x2,x3,...xn)2,...(x1,x2,x3,...xn)T}
上式中,(x1,x2,x3,…xn)表示输入向量,n表示特征数,T表示输入的时序长度,所有时序变量在时刻l的输入为Xl;
步骤6.2、将多变量序列(X1,X2,...XT)进行递归计算,输出序列向量为h1,h2,…,hT,h1,h2,…,hT表示输入时序长期依赖关系的特征向量,每一个序列向量的长度均为c;将长短期记忆网络层的隐含层维度大小设置为d,则hT是长度为d的隐含层变量;隐含层变量通过全连接层处理,得到d×(c+d)的向量hT;向量hT的数据大小为j为4的整数倍;
如图3所示,长短期记忆网络层的隐含层添加三个控制门,以保存长期记忆状态,这可以大大提高预测精确度;三个控制门分别为输入门、遗忘门和输出门;长短期记忆网络层通过输入门、遗忘门和输出门学习并调整水电机组各输入数据集内各数据之间的权重,使得CMI-SAL预测模型达到最优化;输入门决定待更新的输入值;通过遗忘门决定从细胞状态中丢弃的信息,1表示完全保留,0表示完全舍弃;确定哪些新信息被存放在状态细胞中,然后更新细胞状态;输出门最后输出水电机组各输入数据集内各数据之间的权重;计算公式如下:
it=σ(Wi·[ht-1,xt]+bi)
ft=σ(Wf·[ht-1,xt]+bf)
Ot=σ(WO·[ht-1,xt]+bO)
ht=Ot*tanh(Ct)
上式中,it、ft、Ct、Ot、ht分别为输入门、遗忘门、状态节点、记忆细胞、输出门和隐藏层的输出;xt为t时刻的输入值,Ct为t时刻的细胞状态,ht为t时刻的输出值,为候选值;Wi、Wf、WC、WO分别为输入门、遗忘门、状态细胞、输出门权重矩阵;bi、bf、bC、bO分别为输入门、遗忘门、状态细胞、输出门的偏置项;
长短期记忆网络层的激活函数为ReLU函数(修正线性单元):
上式中,x为输入值;
步骤7、如图2所示,将输入时序长期依赖关系的特征向量基于自注意力机制,运用缩放点乘模块计算多头注意力的新的权重表示;通过多头注意力将每个变量时间序列分别和其他变量时序特征相关联,并加权得到一个新向量表示;自注意力机制获取了数据之间的关联性,在水电机组振摆趋势预测问题中,由于不同参量各个时刻的数值具有强相关性,从而导致不同状态属性序列存在较大关联;
步骤7.1、运用缩放点乘模块计算多头注意力的新的权重表示:
步骤7.2、Q、K和V都是原始输入时序长期依赖关系的特征向量经过三个线性投影得到的向量矩阵,其计算关系为:
上式中,Wq、Wk和Wv分别为Q、K和V的矩阵权重参数;
步骤8、使用数据集对CMI-SAL预测模型进行训练,输出振摆预测序列,并用预测集进行预测验证;
步骤8.1、使用步骤3.5得到的输入数据集对CMI-SAL预测模型进行训练,CMI-SAL预测模型首先通过长短期记忆网络层得到捕获输入时间序列长期依赖关系的特征向量hT;
步骤8.2、再通过长短期记忆网络层内的全连接层以及自注意力机制得到每个特征向量hT的新的加权向量,新的加权向量中每一行分别代表g1,g2,g3...gT,大小为j;
步骤8.3、把时间序列长期依赖关系的特征向量hT和每个特征变量的新向量用concatenate函数合并表示成[g1,hT],[g2,hT],[g3,hT],...[g(n-b+1)/a,hT],通过全连接层得到预测标量,输出预测标量作为振摆预测序列;
步骤8.4、使用步骤3.5得到的输出数据集进行预测验证。
步骤9、将待预测振动参量或摆度参量输入训练好的CMI-SAL预测模型中,得到预测结果,并计算预测评估指标;
预测评估指标包括平均绝对误差MAE、平均绝对百分比误差MAPE和均方根误差RMSE:
本发明运用CMI法筛选水电机组振摆状态属性以及引入滑动窗口机制和最大池化法到模型中,缩减数据量,将LSTM和自注意力机制得到的特征向量以及新的加权表示的变量合并,有效改善了长期依赖关系问题,并将每个变量时序包含了其他变量时序的特征,提高预测准确度,从而提高了模型训练效率。实验数据来自浙江仙居电站1号机组2020年8月,以上导轴承X向摆度为例,性能指标计算结果如下表1所示。
表1不同模型对应的预测评估指标结果表
模型 | MAE | MAPE(%) | RMSE |
LSTM | 0.60 | 9.93 | 1.31 |
CMI-LSTM | 0.26 | 4.20 | 0.50 |
本发明模型 | 0.09 | 1.39 | 0.13 |
Claims (10)
1.一种水电机组振摆趋势预测方法,其特征在于,包括以下步骤:
步骤1、获取水电机组振摆监测数据的样本数据集,分析振摆监测数据,绘制待预测振动参量或摆度参量和其他相关参数的关系坐标图,确定候选特征参量;
步骤2、建立CMI-SAL预测模型;
步骤3、通过条件互信息法模块筛选机组关键设备振摆相关工况参数;对工况参数进行整理并提取,形成最终输入数据集和输出数据集;
步骤4、采取z-score标准化方法对输入数据集和输出数据集的数据进行标准化处理,剔除异常值;
上式中,xi表示原始序列,x'i表示标准化后的序列;μi表示序列的平均值,σi表示序列的标准差;输入数据集中的候选特征参量和输出数据集中对应的待预测主参量形成序列;
步骤5、基于卷积层处理标准化后的输入数据集和输出数据集中的数据;引入滑动窗口机制和最大池化法提取其中一类候选特征参量,并缩减数据量;
步骤6、基于长短期记忆网络层处理经过步骤5中基于卷积层处理的水电机组输入数据集和输出数据集,捕获水电机组各输入数据集中的长期依赖关系特征;
步骤7、将输入时序长期依赖关系的特征向量基于自注意力机制,运用缩放点乘模块计算多头注意力的新的权重表示;通过多头注意力将每个变量时间序列分别和其他变量时序特征相关联,并加权得到一个新向量表示;
步骤8、使用步骤3得到的输入数据集和输出数据集对CMI-SAL预测模型进行训练,输出振摆预测序列,并用预测集进行预测验证;
步骤9、将待预测振动参量或摆度参量输入训练好的CMI-SAL预测模型中,得到预测结果,并计算预测评估指标。
2.根据权利要求1所述水电机组振摆趋势预测方法,其特征在于:步骤1中振摆监测数据包括振动参量、摆度参量和其他相关参数,通过分析样本数据集中振动参量、摆度参量和其他相关参数的关系,来绘制待预测振动参量或摆度参量和其他相关参数的关系坐标图;步骤1中其他相关参数包括基于相关机理和经验分析后得到的工况参量,工况参量包括水头、功率和温度;步骤3中待预测主参量为待预测振动参量或摆度参量;步骤6中长短期记忆网络层的超参数设置方式为:设定初始值后,每隔1次训练,打印当前准确率,使用步骤3得到的输入数据集和输出数据集的前80%作为训练集,后20%作为验证集,衡量长短期记忆网络层的性能,一旦准确率上升或损失函数值下降,则微调超参数。
3.根据权利要求1所述水电机组振摆趋势预测方法,其特征在于,步骤3具体包括如下步骤:
步骤3.1、首先选取待预测主参量集合X={x1,x2,...xm},其余各参量形成候选特征参量集合Y={y1,y2,...yn},其中xm为待预测主参量,m为待预测主参量的个数;yn为候选特征参量,n为候选特征参量的个数;
步骤3.2、通过CMI-SAL预测模型计算集合Y中所有候选特征参量与待预测主参量集合X中所有待预测主参量的互信息值I(X;Y);选取互信息值最大的参量,将互信息值最大的参量作为选取的输入参量之一,并从Y中剔除该参量;互信息值I(X;Y)的计算方式为:
待预测主参量xm和候选特征参量yn形成概率密度指数据集F={(xm,yn),m=1,2,...i,n=1,2,...k},其中i为待预测主参量xm的个数,k为候选特征参量yn的个数;垂直于坐标系的横轴和纵轴,将坐标系划分为x×y个网格A;采用CMI-SAL预测模型来计算集合Y中所有候选特征参量与待预测主参量集合X中所有待预测主参量的互信息值I(X;Y),I(X;Y)为概率密度指数据集F中任意一点落在网格中的概率:
上式中,ρ(x,y)表示联合概率密度,联合概率密度为数据集F中落在其中一个网格内的点占F中全部点的比例,ρ(x)、ρ(y)均为边缘概率密度,其中ρ(x)表示待预测主参量集合X中落在其中一个网格内的点占X中全部点的比例,ρ(y)表示候选特征参量集合Y中落在其中一个网格内的点占Y中全部点的比例;
步骤3.3、假设Z为已知条件,在剔除已选参量条件Z情况下,采用CMI-SAL预测模型来计算集合Y中剩余候选特征参量与待预测主参量集合X中所有待预测主参量的条件互信息值:
上式中,p(z)为已知条件Z下的边缘概率密度,p(x,y|z)为已知条件Z下X、Y的联合概率密度函数,p(x|z)和p(y|z)分别为已知条件Z下X和Y的概率密度函数;
步骤3.4、对步骤3.3计算得到的条件互信息值I(X;Y|Z)按大小进行排列,剔除I(X;Y|Z)值趋近于0的条件互信息值对应的候选特征参量与待预测主参量;将剩余候选特征参量与待预测主参量作为机组关键设备振摆相关工况参数;
步骤3.5、将通过条件互信息法筛选出的机组关键设备振摆相关工况参数进行整理并提取,形成最终输入数据集和输出数据集;输入数据集为设定时间段内,以一定时间为间隔的水电机组振摆基础参数候选特征参量数据;输出数据集是滞后于输入数据集设定时期的水电机组振摆基础参数待预测主参量数据。
5.根据权利要求4所述水电机组振摆趋势预测方法,其特征在于,步骤6具体包括如下步骤:
步骤6.1、设多元时序为:
X={(x1,x2,x3,...xn)1,(x1,x2,x3,...xn)2,...(x1,x2,x3,...xn)T}
上式中,(x1,x2,x3,...xn)表示输入向量,n表示特征数,T表示输入的时序长度,所有时序变量在时刻l的输入为Xl;
6.根据权利要求1所述水电机组振摆趋势预测方法,其特征在于,在步骤6中:
长短期记忆网络层的隐含层添加三个控制门,提高预测精确度;三个控制门分别为输入门、遗忘门和输出门;长短期记忆网络层通过输入门、遗忘门和输出门学习并调整水电机组各输入数据集内各数据之间的权重;输入门决定待更新的输入值;通过遗忘门决定从细胞状态中丢弃的信息,1表示完全保留,0表示完全舍弃;确定哪些新信息被存放在状态细胞中,然后更新细胞状态;输出门最后输出水电机组各输入数据集内各数据之间的权重;计算公式如下:
it=σ(Wi·[ht-1,xt]+bi)
ft=σ(Wf·[ht-1,xt]+bf)
Ot=σ(WO·[ht-1,xt]+bO)
ht=Ot*tanh(Ct)
上式中,it、ft、Ct、Ot、ht分别为输入门、遗忘门、状态节点、记忆细胞、输出门和隐藏层的输出;xt为t时刻的输入值,Ct为t时刻的细胞状态,ht为t时刻的输出值,为候选值;Wi、Wf、WC、WO分别为输入门、遗忘门、状态细胞、输出门权重矩阵;bi、bf、bC、bO分别为输入门、遗忘门、状态细胞、输出门的偏置项;
长短期记忆网络层的激活函数为ReLU函数:
上式中,x为输入值。
9.根据权利要求8所述水电机组振摆趋势预测方法,其特征在于,步骤8具体包括如下步骤:
步骤8.1、使用步骤3.5得到的输入数据集对CMI-SAL预测模型进行训练,CMI-SAL预测模型首先通过长短期记忆网络层得到捕获输入时间序列长期依赖关系的特征向量hT;
步骤8.2、再通过长短期记忆网络层内的全连接层以及自注意力机制得到每个特征向量hT的新的加权向量,新的加权向量中每一行分别代表g1,g2,g3…gT,大小为j;
步骤8.3、把时间序列长期依赖关系的特征向量hT和每个特征变量的新向量用concatenate函数合并表示成[g1,hT],[g2,hT],[g3,hT],...[g(n-b+1)/a,hT],通过全连接层得到预测标量,输出预测标量作为振摆预测序列;
步骤8.4、使用步骤3.5得到的输出数据集进行预测验证。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111631550.XA CN114298413B (zh) | 2021-12-28 | 2021-12-28 | 一种水电机组振摆趋势预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111631550.XA CN114298413B (zh) | 2021-12-28 | 2021-12-28 | 一种水电机组振摆趋势预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114298413A true CN114298413A (zh) | 2022-04-08 |
CN114298413B CN114298413B (zh) | 2024-07-23 |
Family
ID=80972154
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111631550.XA Active CN114298413B (zh) | 2021-12-28 | 2021-12-28 | 一种水电机组振摆趋势预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114298413B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115619287A (zh) * | 2022-11-14 | 2023-01-17 | 湖北工业大学 | 基于多源数据融合的水电机组状态劣化评估方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108875841A (zh) * | 2018-06-29 | 2018-11-23 | 国家电网有限公司 | 一种抽蓄机组振动趋势预测方法 |
CN110073301A (zh) * | 2017-08-02 | 2019-07-30 | 强力物联网投资组合2016有限公司 | 工业物联网中具有大数据集的数据收集环境下的检测方法和系统 |
CN112633317A (zh) * | 2020-11-02 | 2021-04-09 | 国能信控互联技术有限公司 | 基于注意力机制的cnn-lstm风机故障预测方法及系统 |
CN113592188A (zh) * | 2021-08-06 | 2021-11-02 | 国网四川省电力公司 | 一种基于深度学习理论的梯级电站水力关系耦合方法 |
JPWO2021241487A1 (zh) * | 2020-05-25 | 2021-12-02 |
-
2021
- 2021-12-28 CN CN202111631550.XA patent/CN114298413B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110073301A (zh) * | 2017-08-02 | 2019-07-30 | 强力物联网投资组合2016有限公司 | 工业物联网中具有大数据集的数据收集环境下的检测方法和系统 |
CN108875841A (zh) * | 2018-06-29 | 2018-11-23 | 国家电网有限公司 | 一种抽蓄机组振动趋势预测方法 |
JPWO2021241487A1 (zh) * | 2020-05-25 | 2021-12-02 | ||
CN112633317A (zh) * | 2020-11-02 | 2021-04-09 | 国能信控互联技术有限公司 | 基于注意力机制的cnn-lstm风机故障预测方法及系统 |
CN113592188A (zh) * | 2021-08-06 | 2021-11-02 | 国网四川省电力公司 | 一种基于深度学习理论的梯级电站水力关系耦合方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115619287A (zh) * | 2022-11-14 | 2023-01-17 | 湖北工业大学 | 基于多源数据融合的水电机组状态劣化评估方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114298413B (zh) | 2024-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116757534B (zh) | 一种基于神经训练网络的智能冰箱可靠性分析方法 | |
Lindemann et al. | Anomaly detection and prediction in discrete manufacturing based on cooperative LSTM networks | |
CN108445752B (zh) | 一种自适应选择深度特征的随机权神经网络集成建模方法 | |
CN109101584B (zh) | 一种将深度学习与数学分析相结合的句子分类改进方法 | |
CN113177357B (zh) | 一种电力系统暂态稳定评估方法 | |
CN108051660A (zh) | 一种变压器故障组合诊断模型建立方法及诊断方法 | |
CN113255848A (zh) | 基于大数据学习的水轮机空化声信号辨识方法 | |
CN114218872B (zh) | 基于dbn-lstm半监督联合模型的剩余使用寿命预测方法 | |
CN111241755A (zh) | 电力负荷预测方法 | |
CN113642754A (zh) | 一种基于rf降噪自编码信息重构和时间卷积网络的复杂工业过程故障预测方法 | |
CN111784061B (zh) | 一种电网工程造价预测模型的训练方法、装置和设备 | |
CN109298633A (zh) | 基于自适应分块非负矩阵分解的化工生产过程故障监测方法 | |
CN116956197B (zh) | 基于深度学习的能源设施故障预测方法、装置及电子设备 | |
CN114118225A (zh) | 发电机剩余寿命预测方法、系统、电子设备和存储介质 | |
Huang et al. | Bayesian neural network based method of remaining useful life prediction and uncertainty quantification for aircraft engine | |
CN116910559A (zh) | 一种面向电网超算中心智能运维应用的指标异常检测方法 | |
CN117458480A (zh) | 基于改进lof的光伏发电功率短期预测方法及系统 | |
CN117633688A (zh) | 一种基于岭回归-k均值聚类-LOF-LSTM融合算法的大规模电力数据异常检测方法 | |
CN115221942A (zh) | 一种基于时序融合和神经网络的设备缺陷预测方法及系统 | |
CN114298413B (zh) | 一种水电机组振摆趋势预测方法 | |
CN114118401A (zh) | 基于神经网络的配电网络流量预测方法、系统、装置及存储介质 | |
Xu et al. | A composite quantile regression long short-term memory network with group lasso for wind turbine anomaly detection | |
Wenqiang et al. | Remaining useful life prediction for mechanical equipment based on temporal convolutional network | |
Dang et al. | seq2graph: Discovering dynamic non-linear dependencies from multivariate time series | |
CN113158448A (zh) | 一种船舶系统设备阈值的自适应计算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |