CN109992608B - 一种基于频域的多模型融合预测方法和系统 - Google Patents

一种基于频域的多模型融合预测方法和系统 Download PDF

Info

Publication number
CN109992608B
CN109992608B CN201910230755.3A CN201910230755A CN109992608B CN 109992608 B CN109992608 B CN 109992608B CN 201910230755 A CN201910230755 A CN 201910230755A CN 109992608 B CN109992608 B CN 109992608B
Authority
CN
China
Prior art keywords
data
frequency domain
prediction
time sequence
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201910230755.3A
Other languages
English (en)
Other versions
CN109992608A (zh
Inventor
姜晓红
杜定益
吴健
孙浩
吴朝晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201910230755.3A priority Critical patent/CN109992608B/zh
Publication of CN109992608A publication Critical patent/CN109992608A/zh
Application granted granted Critical
Publication of CN109992608B publication Critical patent/CN109992608B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/148Wavelet transforms

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于频域的多模型融合预测方法和系统,包括:建立数据库实时存储监控器测量所得的数据;对原始时序数据预处理,包括异常值检测及缺失值处理;对干净的时序数据通过小波变换转为频域数据;建立循环神经网络及可加性回归模型对频域系数进行预测;选取最优权重和阈值得到最佳预测结果。本发明通过对预处理之后的时序数据变换到频域上进行分析处理,并融合不同模型得到最佳预测结果,克服了传统时序预测模型预测周期短,预测精度低等缺点。

Description

一种基于频域的多模型融合预测方法和系统
技术领域
本发明属于数据分析领域,尤其是涉及一种基于频域的多模型融合预测方法和系统。
背景技术
随着大数据时代的到来,数据挖掘技术为数据未来趋势预测提供了一种新的方法。在无法很好确定原始数据内部相互规律、作用机理的情况下,可以考虑从数据挖掘技术的角度建立时间序列模型,然而,传统的时序模型在时间序列预测上存在着很多弊端。
公开号为CN108984893A的中国专利文献公开了一种基于梯度提升方法的趋势预测方法,步骤如下:一:设定梯度提升模型参数,对预测模型进行初始化;二:定期采集轴承振动信号,提取特征参数;三:对特征参数进行判断,判断是否有故障迹象;四:利用训练集数据训练梯度提升模型,通过验证集数据对模型进行性能评估;五:调整梯度提升模型参数;六:利用预测模型进行轴承趋势预测。
通过以上步骤训练得到的最终模型即可实现对轴承的趋势预测,通过得到的预测结果可及时对轴承进行维护,然而上述方法存在预测结果不稳定、精度不够高的问题。
发明内容
本发明针对当前的时序数据分析模型长期预测能力不足,预测精度低的问题,提出了一种基于频域的多模型融合预测方法和系统。
为实现上述目的,本发明采用以下技术方案:
一种基于频域的多模型融合预测系统,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,所述计算机存储器中存有以下模块:
数据库系统模块,用于存储监控器测量得到的原始时序数据,同时提供与其他模块之间的数据连接查询;
数据预处理模块,用于对数据库系统模块存储的原始时序数据进行预处理;
频域变换模块,用于将预处理后的原始时序数据进行频域变换,转为频域特征数据并进行存储;
趋势预测模块,内含循环神经网络模型和可加性回归模型,用于对频域特征数据中的高频与低频部分进行系数预测,并将结果重构为时序时间数据;
模型融合模块,用于将趋势预测模块中重构后得到的时序时间数据进行融合,输出最优预测数据。
本发明提出的一个基于频域的多模型融合预测框架,通过将时域数据转为频域数据,对频域不同成分进行系数预测及重构,并通过权重融合多个模型的预测结果,实现时序数据的趋势预测,长期预测性能好,预测精度高。
所述数据库系统模块包括多张数据库表,数据库表主要存储时序数据,数据的存储结构繁杂。
所述数据预处理模块包括异常值检测和缺失值处理两个部分。原始时序数据是不完整的、有噪音的,因此数据预处理模块可以处理这些粗糙数据,并且最终得到完整正确的时序数据;
所述频域变换模块进行频域变换时,采用DB3小波作为基小波,分解层数为三层。
作为优选,趋势预测模块中,所述的循环神经网络采用LSTM模型,迭代次数设置为2000,单隐层中节点个数为6,并采用Adam算法对梯度下降过程进行优化;所述的可加性回归模型采用prophet模型,增长趋势采用logistics模型,季节性周期设置为7。
循环神经网络模型及可加性回归模型通过调整不同参数训练得到最佳结果,实现频域系数的预测集重构后时序数据的输出。
所述模型融合模块通过权重因子ρ和突变点阈值a将趋势预测模块中重构后得到的时序时间数据进行融合;所述权重因子ρ采用网格法逐一试验分析,选取最佳权重,所述突变点阈值a采用与平均值的偏差超过三倍标准差的值作为临界阈值。
本发明还提供了一种利用上述基于频域的多模型融合预测系统进行预测的方法,包括以下步骤:
(1)将监控器实时测量得到的原始时序数据存储到数据库系统模块中;
(2)利用数据预处理模块对原始时序数据进行预处理,包括剔除错误值、空值以及填补缺失值;
(3)使用频域变换模块将预处理后的原始时序数据进行频域变换,转为频域特征数据并进行存储;
(4)分别采用循环神经网络模型及可加性回归模型对频域特征数据的高频与低频部分进行预测,得到相应的预测结果,之后通过小波重构算法将预测得到的频域系数重构为时序时间数据;
(5)通过权重因子ρ和突变点阈值a对重构后得到的时序时间数据进行融合,输出最优预测数据。
现有的时序模型在时间序列预测上大多采用在时域上进行预测,存在预测时间短,准确性等缺点。与现有技术相比,本发明具有以下有益效果:
1、本发明在数据库系统模块中建立数据特征表,存储监控仪测量数据,实现实时地在线和离线数据分析。
2、本发明小波分析理论,将时域上的数据通过小波变换分解到不同的频域上,对频域上的数据进行预测,最后再通过逆变换将各频域转换为时域序列。由于分解后频域上的数据相对比较平滑,不同频域的信号表示为原始信号的部分信息,因此在频域上无论是在短期还是长期的预测都更加稳定准确。同时,本发明综合考虑不同模型的预测结果,提出了基于频域的多模型融合预测方法,创造性地结合了不同模型的优点,大大提高了时间序列模型的长期预测能力和预测精度。
附图说明
图1为本发明实施例中一种基于频域的多模型融合预测方法的流程图;
图2为本发明实施例中不同小波变换信噪比与峰值误差结果图;
图3为本发明实施例中建立LSTM模型时误差随迭代次数下降关系图;
图4为本发明实施例中建立LSTM模型时隐藏层节点数与误差关系图;
图5为本发明实施例中不同模型对填埋气不同成分预测结果RMSE对比图。
具体实施方式
下面结合附图和实施例对本发明做进一步详细描述,需要指出的是,以下所述实施例旨在便于对本发明的理解,而对其不起任何限定作用。
如图1所示,一种基于频域的多模型融合预测方法,包括以下步骤:
(1)将监控器实时测量得到的原始时序数据存储到数据库系统模块中。
本实施例选择某垃圾填埋场的时序数据作为原始数据,建立对应的数据库系统,得到的原始时序数据的数据库表如表1所示。
表1
Figure BDA0002006638290000051
(2)利用数据预处理模块对原始时序数据进行预处理,包括剔除错误值、空值以及填补缺失值。
原始数据是不完整的、有噪音的,因此数据预处理模块可以处理这些粗糙数据,并且最终得到完整正确的数据,预处理包括剔除错误值、空值以及填补缺失值。
(3)使用频域变换模块将预处理后的原始时序数据进行频域变换,转为频域特征数据并进行存储。
频域变换模块主要是根据预处理后的原始时序数据,将其转为频域特征数据,主要步骤为:
首先确定小波函数,小波函数中常见的离散小波族有三种:Daubechies小波族,Symlets小波族和Coiflet小波族。本发明通过对填埋气数据进行不同小波族的小波函数变换,然后通过将重构后的时间序列与原序列在信噪比和峰值误差上进行比较的方法来选取最优小波函数。并考虑如下两种比较方法:1、同一小波族中不同长度的小波信噪比和峰值误差的大小;2、不同小波族中相同长度的小波信噪比和峰值误差的大小。不同小波变换信噪比(SNR)和峰值误差(PCDE)的实验结果参见图2。图中(a)为不同小波变换信噪比的结果图,(b)为不同小波变换峰值误差结果图,可以看出,Db3、Db4、Sym3、Sym4信噪比大致相当,而DB3的峰值误差最低,因此选择DB3作为基小波。
其次使用Db3小波对填埋气分别进行小波一到五层的分解重构。通过计算发现,三层小波分解下的模型重构误差要低于另外几层的重构误差,因此,本发明选取的最佳小波分解层数为三层。各分解层数下的重构误差如表2所示。
表2
Figure BDA0002006638290000061
(4)分别采用循环神经网络模型及可加性回归模型对频域特征数据的高频与低频部分进行预测,得到相应的预测结果,之后通过小波重构算法将预测得到的频域系数重构为时序时间数据。
本实施例中,在经过上述小波变换处理后,得到4个特征向量作为LSTM模型的自变量,同时将风向、风速、温度、压强、相对湿度5个特征向量作为协变量,将其共同作为LSTM模型的输入参数,输出参数为相应的频域特征向量,选取ReLU函数为激活函数,均方误差作为损失函数,建立LSTM模型。
同时,在训练模型过程中,一阶梯度下降算法容易使得模型陷入局部最优解,且当模型变得复杂时,梯度下降算法存在运算量大,训练时间长等问题。针对这一情况,本发明采用Adam算法代替传统随机梯度算法对网络训练过程进行优化。
实验采用前77天共22176条数据进行训练,后7天数据进行准确度测试,其中输入参数个数为9,输出个数为4。隐藏层特征数根据经验值设置为6。
LSTM模型建立具体步骤分为两步:
首先确定迭代次数,实验结果如图3所示。可以看出,随着迭代次数的数量增加,误差在逐步减小,但当在迭代次数到达2000左右时,误差下降变得缓慢,且此时误差已符合精度阈值,故本文采用迭代次数为2000。
之后通过确定隐藏层的隐藏层节点数,实验表明,当隐藏层节点数为8时误差最小。隐藏层节点数与相对误差变化趋势如图4所示。
建立可加性回归模型时通过对不同参数值的试验、调整,最终得到如表3所示的prophet模型参数表。
表3
Figure BDA0002006638290000071
表3中,growth为增长趋势模型,使用logistic函数表示非线性增长模型;cap表示为填埋气中各成分在非线性模型中增长趋势相对应的限定最大值;seasonality_prior_scale表示季节性模型中季节性组件强度设定值,值越大,模型将更适应强季节性波动;holidays_prior_scale表示节假日模型中节假日组件强度值;freq表示统计单位,M代表以分钟为单位;periods表示需要预测的未来时间的个数,本文中设置为288,既针对数据集每5分钟采样的间隔,总共预测接下来一天的填埋气浓度值。其它剩余参数值使用模型默认参数值。
(5)通过权重因子ρ和突变点阈值a对重构后得到的时序时间数据进行融合,输出最优预测数据。
基于以上分析处理,a通过与平均值的偏差超差超过三倍标准差的值作为临界阈值,ρ通过网格式计算寻找最小偏差的方法确定。最终求得填埋气CO2、H2S、NH3、PID、PM2.5各成分系数a如表4所示。
表4
Figure BDA0002006638290000081
系数ρ通过网格法取不同值,以相对标准偏差判断数据总体拟合程度,以一阶导数偏差判断数据突变点拟合程度,分别计算填埋气各成分预测值的相对标准偏差和一阶导数偏差,得到表5、表6数据。
表5
Figure BDA0002006638290000082
表6
Figure BDA0002006638290000083
Figure BDA0002006638290000091
选取不同的融合系数如表7所示,不同的突变点阈值如表8所示,建立融合模型,输出预测结果
表7
Figure BDA0002006638290000092
表8
Figure BDA0002006638290000093
将本发明提出的预测方法得到的预测结果与现有的其他预测模型进行对比,如图5所示,从图中可以看出,本发明的方法在准确度上相比传统预测算法在预测结果的准确度上有着明显的提升。
以上所述的实施例对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的具体实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换,均应包含在本发明的保护范围之内。

Claims (1)

1.一种基于频域的多模型融合预测系统,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,其特征在于,所述计算机存储器中存有以下模块:
数据库系统模块,用于存储监控器测量得到的原始时序数据,同时提供与其他模块之间的数据连接查询;包括若干张用于存储实时数据的数据库表;
数据预处理模块,用于对数据库系统模块存储的原始时序数据进行预处理;包括异常值检测和缺失值处理两个部分;
频域变换模块,用于将预处理后的原始时序数据进行频域变换,转为频域特征数据并进行存储;所述频域变换模块进行频域变换时,采用DB3小波作为基小波,分解层数为三层;
趋势预测模块,内含循环神经网络模型和可加性回归模型,用于对频域特征数据中的高频与低频部分进行系数预测,并通过小波重构算法将预测得到的频域系数重构为时序时间数据;所述的循环神经网络采用LSTM模型,迭代次数设置为2000,单隐层中节点个数为8,并采用Adam算法对梯度下降过程进行优化;所述的可加性回归模型采用prophet模型,增长趋势采用logistics模型,季节性周期设置为7;
模型融合模块,用于将趋势预测模块中重构后得到的时序时间数据进行融合,输出最优预测数据;所述模型融合模块通过权重因子ρ和突变点阈值a将趋势预测模块中重构后得到的时序时间数据进行融合;所述权重因子ρ采用网格法逐一试验分析,选取最佳权重,所述突变点阈值a采用与平均值的偏差超过三倍标准差的值作为临界阈值;
进行预测的方法,包括以下步骤:
(1)将监控器实时测量得到的原始时序数据存储到数据库系统模块中;
(2)利用数据预处理模块对原始时序数据进行预处理,包括剔除错误值、空值以及填补缺失值;
(3)使用频域变换模块将预处理后的原始时序数据进行频域变换,转为频域特征数据并进行存储;
(4)分别采用循环神经网络模型及可加性回归模型对频域特征数据的高频与低频部分进行预测,得到相应的预测结果,之后通过小波重构算法将预测得到的频域系数重构为时序时间数据;
(5)通过权重因子ρ和突变点阈值a对重构后得到的时序时间数据进行融合,输出最优预测数据。
CN201910230755.3A 2019-03-26 2019-03-26 一种基于频域的多模型融合预测方法和系统 Expired - Fee Related CN109992608B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910230755.3A CN109992608B (zh) 2019-03-26 2019-03-26 一种基于频域的多模型融合预测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910230755.3A CN109992608B (zh) 2019-03-26 2019-03-26 一种基于频域的多模型融合预测方法和系统

Publications (2)

Publication Number Publication Date
CN109992608A CN109992608A (zh) 2019-07-09
CN109992608B true CN109992608B (zh) 2022-03-04

Family

ID=67131519

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910230755.3A Expired - Fee Related CN109992608B (zh) 2019-03-26 2019-03-26 一种基于频域的多模型融合预测方法和系统

Country Status (1)

Country Link
CN (1) CN109992608B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111353523A (zh) * 2019-12-24 2020-06-30 中国国家铁路集团有限公司 一种对铁路客户进行分类的方法
CN111754033A (zh) * 2020-06-15 2020-10-09 西安工业大学 一种基于循环神经网络的非平稳时序数据预测方法
CN111950805B (zh) * 2020-08-25 2022-09-20 华润数字科技有限公司 中长期电力负荷预测方法、装置、计算机设备及存储介质
CN112330030B (zh) * 2020-11-09 2022-09-23 国网江苏省电力有限公司 业扩物资需求预测系统及方法
CN114666236B (zh) * 2022-03-29 2024-05-14 北京扬铭科技发展有限责任公司 一种全自动信号检测识别报警方法
CN114936203B (zh) * 2022-05-20 2023-04-07 北京思路智园科技有限公司 基于时序数据和业务数据融合分析的方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6772185B1 (en) * 1999-06-02 2004-08-03 Japan Science And Technology Corporation Time-series predicting method using wavelet number series and device thereof
CN102609766A (zh) * 2012-02-17 2012-07-25 中南大学 一种风电场风速智能预测方法
CN104376368A (zh) * 2014-08-19 2015-02-25 上海交通大学 一种基于频域分解的风力发电短期负荷预测方法及装置
CN106384170A (zh) * 2016-09-24 2017-02-08 华北电力大学(保定) 基于小波分解与重构的时间序列风速预测方法
CN107102969A (zh) * 2017-04-28 2017-08-29 湘潭大学 一种时间序列数据的预测方法和系统
CN107885951A (zh) * 2017-11-27 2018-04-06 河海大学 一种基于组合模型的水文时间序列预测方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101609445A (zh) * 2009-07-16 2009-12-23 复旦大学 基于时间信息的关键子话题提取方法
CN108154170B (zh) * 2017-12-14 2021-11-05 北京师范大学 一种长时间序列的ndvi数据产品融合方法
CN109145825B (zh) * 2018-08-24 2020-07-03 广东石油化工学院 一种相干噪声滤除方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6772185B1 (en) * 1999-06-02 2004-08-03 Japan Science And Technology Corporation Time-series predicting method using wavelet number series and device thereof
CN102609766A (zh) * 2012-02-17 2012-07-25 中南大学 一种风电场风速智能预测方法
CN104376368A (zh) * 2014-08-19 2015-02-25 上海交通大学 一种基于频域分解的风力发电短期负荷预测方法及装置
CN106384170A (zh) * 2016-09-24 2017-02-08 华北电力大学(保定) 基于小波分解与重构的时间序列风速预测方法
CN107102969A (zh) * 2017-04-28 2017-08-29 湘潭大学 一种时间序列数据的预测方法和系统
CN107885951A (zh) * 2017-11-27 2018-04-06 河海大学 一种基于组合模型的水文时间序列预测方法

Also Published As

Publication number Publication date
CN109992608A (zh) 2019-07-09

Similar Documents

Publication Publication Date Title
CN109992608B (zh) 一种基于频域的多模型融合预测方法和系统
CN108280552B (zh) 基于深度学习的电力负荷预测方法和系统、存储介质
CN112327219A (zh) 特征自动挖掘和参数自动寻优的配电变压器故障诊断方法
CN113240187B (zh) 预测模型生成方法、系统、设备、存储介质及预测方法
CN111079989B (zh) 一种基于dwt-pca-lstm的供水公司供水量预测装置
CN110766200A (zh) 一种基于K-means均值聚类的风电机组发电功率预测方法
CN111027775A (zh) 基于长短期记忆网络的梯级水电站发电量预测方法
CN112668611B (zh) 一种基于Kmeans和CEEMD-PE-LSTM的短期光伏发电功率预测方法
CN113411216B (zh) 基于离散小波变换和fa-elm的网络流量预测方法
CN111401599A (zh) 一种基于相似性搜索和lstm神经网络的水位预测方法
CN114970952B (zh) 一种考虑环境因素的光伏出力短期预测方法及系统
CN115293326A (zh) 电力负荷预测模型的训练方法、装置及电力负荷预测方法
CN112434891A (zh) 基于wcnn-alstm的太阳辐照度时间序列的预测方法
CN115146842A (zh) 基于深度学习的多元时间序列趋势预测方法和系统
CN112418545A (zh) 一种基于负荷特征及模型融合的售电量预测方法及系统
CN116383773A (zh) 基于自适应预测区间的数据中心能效异常检测方法、系统和介质
CN116933922A (zh) 基于woa-cnn-lstm光伏发电功率预测的方法
CN115222138A (zh) 一种基于eemd-lstm微网光伏短期功率区间预测方法
CN111292121A (zh) 一种基于园区画像的园区负荷预测方法及系统
CN117592593A (zh) 基于改进二次模态分解和WOA优化BILSTM-attention的短期电力负荷预测方法
CN117290685A (zh) 一种基于历史数据的电厂电力设备专家诊断系统及方法
CN113514743A (zh) 一种基于多维特征的gis局部放电模式识别系统构建方法
Su et al. A LSTM based wind power forecasting method considering wind frequency components and the wind turbine states
CN116167465A (zh) 基于多变量时间序列集成学习的太阳辐照度预测方法
CN114862032B (zh) 一种基于XGBoost-LSTM的电网负荷预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220304