CN114548479A - 一种基于指数平滑的时序数据预测方法 - Google Patents

一种基于指数平滑的时序数据预测方法 Download PDF

Info

Publication number
CN114548479A
CN114548479A CN202111554557.6A CN202111554557A CN114548479A CN 114548479 A CN114548479 A CN 114548479A CN 202111554557 A CN202111554557 A CN 202111554557A CN 114548479 A CN114548479 A CN 114548479A
Authority
CN
China
Prior art keywords
model
data
months
sub
month
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111554557.6A
Other languages
English (en)
Inventor
俞文翰
赵彤
孙丰诚
潘凡
倪军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou AIMS Intelligent Technology Co Ltd
Original Assignee
Hangzhou AIMS Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou AIMS Intelligent Technology Co Ltd filed Critical Hangzhou AIMS Intelligent Technology Co Ltd
Priority to CN202111554557.6A priority Critical patent/CN114548479A/zh
Publication of CN114548479A publication Critical patent/CN114548479A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出一种基于指数平滑的时序数据预测方法,包括以下步骤:S1,利用历史数据建立基于指数平滑模型的离线模型,所述离线模型包括若干周期的子模型;S2,所有子模型定期训练,得到预测结果和平移变量;S3,获取待预测的时间长度以及当前时间,得到未来日期;S4,根据未来日期选取对应周期的子模型;S5,将对应周期的子模型的平移变量,将预测结果向上或向下平移,得到最终预测结果。基于指数平滑模型,使该模型拥有较好的预测带趋势的周期性时序数据的能力。本发明使用了多组子模型分段创建的方法,且可以根据预测时间长度的不同来选择合适的子模型,解决了预测时细节处精确度差的问题。

Description

一种基于指数平滑的时序数据预测方法
技术领域
本发明涉及数据预测技术领域,尤其是一种基于指数平滑的时序数据预测方法。
背景技术
时序数据预测在工业、金融业、计算机业等领域中出现的频率非常广泛,它是通过对历史的时序数据加以分析,来预测生成未来的时序数据。在工业设备可靠性管理(Equipment Reliability Management)领域中,它往往可以预测出一台设备未来的健康状态;也可以预测出一台设备未来的工作效率;还可以预测出该时序数据何时超过阈值。电厂热交换器是保障电站正常运行的重要热交换部件,热交换器换热能力的退化是使用过程中面临的痛点,往往需要通过反冲洗或解体清洗来恢复换热能力,耗费大量人力物力。其中导致热交换器能力退化的主要因素为海水温度过高和海水流速,利用该技术方案来预测海水温度过高的时间,提前为反冲洗做好准备。
目前现存的预测方法主要有非周期性时序数据预测和周期性时序数据预测这两大类。现有的非周期性时序数据预测在预测时由于没有考虑数据的周期性特征,预测精确度差;现有的周期性时序数据预测是将构建一个完整的模型进行预测的,不同于本技术的分段方法,存在无法根据预测时间长度来调整模型,细节上精确度差,在案例中无法准确预测夏季海水温度。现有的预测方法没有评判预测结果好坏的方法,很多情况下需要人工辅助判断。由于现有的指数平滑模型将数据的总体趋势考虑在内,但实际上很多情况下预测数据的趋势和近期趋势有关,如案例中预测的海水温度趋势和近年来海水温度趋势有较大关系,和整体趋势关系不大,这样预测结果的趋势性就存在错误。
发明内容
本发明解决了现有技术对周期性时序数据预测不准确的问题,提出一种基于指数平滑的时序数据预测方法,基于指数平滑模型,使该模型拥有较好的预测带趋势的周期性时序数据的能力。本发明使用了多组子模型分段创建的方法,且可以根据预测时间长度的不同来选择合适的子模型,解决了预测时细节处精确度差的问题。
为实现上述目的,提出以下技术方案:
一种基于指数平滑的时序数据预测方法,包括以下步骤:
S1,利用历史数据建立基于指数平滑模型的离线模型,所述离线模型包括若干周期的子模型;
S2,所有子模型定期训练,得到预测结果和平移变量;
S3,获取待预测的时间长度以及当前时间,得到未来日期;
S4,根据未来日期选取对应周期的子模型;
S5,将对应周期的子模型的平移变量,将预测结果向上或向下平移,得到最终预测结果。
本发明基于指数平滑模型,使该模型拥有较好的预测带趋势的周期性时序数据的能力。本发明使用了多组子模型分段创建的方法,且可以根据预测时间长度的不同来选择合适的子模型,解决了预测时细节处精确度差的问题。
作为优选,所述子模型的周期包括1个月、3个月、6个月和12个月。
作为优选,所述指数平滑模型为三次指数平滑模型。
作为优选,所述子模型在每个月的月初进行训练。
作为优选,所述S2具体包括以下步骤:
S201,对获得的历史数据进行预处理,并将历史数据拆分为训练数据、验证数据和测试数据;S202,使用趋势分析算法获得训练数据总体趋势,将总体趋势和训练数据作为指数平滑的参数训练模型;
S203,对指数平滑的参数训练模型进行训练,得到预测结果和初步平移变量;
S204,用验证数据来平移优化预测结果的加权目标函数,并用测试数据来测试优化后的效果,若优化后的评价指标整体比优化前的评价指标好,则保存预测结果的优化平移变量,若优化后的评价指标整体比优化后的评价指标差,则将优化平移变量置0并保存。
本发明使用了加权目标函数来评判模型预测结果的好坏,根据实际情况通过改变目标函数的权值来改变评判标准,在大多数情况下不需要人工辅助判断。
本发明使用了预测结果趋势平移的办法,使用近期趋势情况对预测结果进行平移修正,解决了预测结果趋势错误的问题。
作为优选,所述S201具体包括以下步骤:
S211,剔除异常数据,将数据处理分为以12个月开始的、4个不同周期性长度的四十八个子数据,所述4个不同周期性长度包括1个月、3个月、6个月和12个月;
S212,数据以年为单位按一定比例拆分为训练数据、验证数据、测试数据。
作为优选,所述S4具体包括以下步骤:判断未来日期是否在本月月初加上1个月范围之内,若是则选用周期长度为1个月的子模型;若否,判断未来日期是否在本月月初加上3个月范围之内,若是则选用周期长度为3个月的子模型;若否,判断未来日期是否在本月月初加上6个月范围之内,若是则选用周期长度为6个月的子模型;若否,则选用周期长度为12个月的子模型。
本发明的有益效果是:
本发明基于指数平滑模型,使该模型拥有较好的预测带趋势的周期性时序数据的能力。
本发明使用了多组子模型分段创建的方法,且可以根据预测时间长度的不同来选择合适的子模型,解决了预测时细节处精确度差的问题。
本发明使用了加权目标函数来评判模型预测结果的好坏,根据实际情况通过改变目标函数的权值来改变评判标准,在大多数情况下不需要人工辅助判断。
本发明使用了预测结果趋势平移的办法,使用近期趋势情况对预测结果进行平移修正,解决了预测结果趋势错误的问题。
附图说明
图1是实施例的方法流程图;
图2是实施例数据预处理过程图;
图3是实施例训练数据的时序图;
图4是实施例子模型选择流程图。
具体实施方式
实施例:
本实施例以预测海水温度变化为例,参考图1,提出一种基于指数平滑的时序数据预测方法,本方法具体包括在线应用步骤和离线模型训练步骤。
在线应用主要操作步骤是用户在线输入需要预测的时间长度L和当前时间T;根据L和T从离线模型训练中获得合适的指数平滑模型和预测结果的优化平移变量;使用获得的指数平滑模型进行预测,使用平移变量对预测结果的总体趋势进行平移优化;最终在设备的预测场景中显示预测结果,进行预测结果的分析比较。在线应用部分结束。
离线模型训练主要操作步骤是按照模型的不同周期性长度预处理设备历史时序数据,将数据拆分为训练数据、验证数据和测试数据;使用趋势分析算法判断训练数据总体趋势是否平稳,将趋势和训练数据作为指数平滑的参数训练模型;用验证数据来平移优化预测结果的加权目标函数,并用测试数据来测试优化后的效果,若优化后的评价指标整体比优化前的评价指标好,则保存预测结果的优化平移变量,若优化后的评价指标整体比优化后的评价指标差,则将优化平移变量置0并保存。离线模型训练部分结束。
本实施例的具体步骤包括:
S1,利用历史数据建立基于三次指数平滑模型的离线模型,离线模型包括若干周期的子模型;子模型的周期包括1个月、3个月、6个月和12个月。
三次指数平滑适用于预测有趋势性且有周期性的数据,三次指数平滑的公式有累加和累乘两种,本实施例采用累加类:
St=α(xt-Ct-l)+(1-α)(St-1+Bt-1)α为数据平滑因子0<α<1
Bt=β(St-St-1)+(1-β)Bt-1β为趋势平滑因子0<β<1
Ct=γ(xt-St-1-Bt-1)+(1-γ)Ct-lγ为季节平滑因子0<γ<1
Ft+m=St+mBt +Ct-l+1+(m-1)modl
Ft+m就是从t刻开始预测,预测长度为m,数据的周期长度为1。
S2,所有子模型在每个月的月初进行训练,得到预测结果和平移变量;本实施例中每个月的月初都需要进行一次模型训练,由于每个月的天数不一致且为了方便模型后续的修改,模型和数据类似也被分成了一个月一组。由于指数平滑模型的特性是模型的周期长度越短,模型在细节上的精度相对越高。所以当需要一个近期的预测时,可用周期长度较短的模型来预测;当需要预测的时间较长时,选用周期长度较长的模型来预测。周期长度在一个月、三个月、六个月、十二个月的时候效果最好。最后将这些模型保存起来,待在线应用部分调用。
S2具体包括以下步骤:
S201,对获得的历史数据进行预处理,并将历史数据拆分为训练数据、验证数据和测试数据;
S201具体包括以下步骤:
S211,剔除异常数据,参考图2,由于本实施例数据监测设备共有两组,所以会得到两份海水温度数据。通过对两组数据做差值,差值过大的地方是数据存在异常的情况,需剔除。由于本实施例中指数平滑模型是按每个月为一组,每组又根据不同的周期性长度被划分为了四个,将数据处理分为以12个月开始的、4个不同周期性长度的四十八个子数据,4个不同周期性长度包括1个月、3个月、6个月和12个月;以1月为例参考表一:
表一1月份数据处理表
Figure BDA0003418724260000041
Figure BDA0003418724260000051
S212,数据以年为单位按一定比例拆分为训练数据、验证数据、测试数据。本实施例中以5∶2∶1的比例来拆分数据,最终得到2013年1月-2017年12月的训练数据、2018年1月-2019年12月的验证数据、2020年1月-2020年12月的测试数据,其中训练数据如图3;
S202,使用趋势分析算法获得训练数据总体趋势,将总体趋势和训练数据作为指数平滑的参数训练模型;
S203,对指数平滑的参数训练模型进行训练,得到预测结果和初步平移变量;
S204,用验证数据来平移优化预测结果的加权目标函数,并用测试数据来测试优化后的效果,若优化后的评价指标整体比优化前的评价指标好,则保存预测结果的优化平移变量,若优化后的评价指标整体比优化后的评价指标差,则将优化平移变量置0并保存。从离线模型训练部分中获得平移变量,将预测结果向上或向下平移,平移长度为平移变量的绝对值。平移变量为正,预测结果向上平移;平移变量为负,预测结果向下平移。
由于数据的整体性趋势无法很好的代表预测趋势,所以需要使用验证数据平移指数平滑模型的预测结果来使加权目标函数的值最小。在案例中即使训练数据整体平稳,但如果训练数据的近1-2年存在趋势,那么真实结果很有可能存在这种趋势。
加权目标函数:该目标函数是由多个评价指标的加权组成的,通过一个比较客观的方式评价预测结果好坏。案例中使用的加权目标函数为:
f=0.4*RMSE+0.5*R_square+0.1*max_error(舍弃最大误差的前0.5%);
将优化前的预测结果和优化后的预测结果分别和测试数据生成多种评价指标,其中评价指标有RMSE、MSE、R_square、max_error、MAPE。再对照观察两组评价指标,若优化前的评价指标整体优于优化后的评价指标,那么将上一步的平移变量置为0。最后保存平移变量,待在线应用部分调用。
S3,获取待预测的时间长度以及当前时间,得到未来日期;
S4,根据未来日期选取对应周期的子模型;参考图4,S4具体包括以下步骤:判断未来日期是否在本月月初加上1个月范围之内,若是则选用周期长度为1个月的子模型;若否,判断未来日期是否在本月月初加上3个月范围之内,若是则选用周期长度为3个月的子模型;若否,判断未来日期是否在本月月初加上6个月范围之内,若是则选用周期长度为6个月的子模型;若否,则选用周期长度为12个月的子模型。
S5,将对应周期的子模型的平移变量,将预测结果向上或向下平移,得到最终预测结果。

Claims (7)

1.一种基于指数平滑的时序数据预测方法,包括以下步骤:
S1,利用历史数据建立基于指数平滑模型的离线模型,所述离线模型包括若干周期的子模型;
S2,所有子模型定期训练,得到预测结果和平移变量;
S3,获取待预测的时间长度以及当前时间,得到未来日期;
S4,根据未来日期选取对应周期的子模型;
S5,将对应周期的子模型的平移变量,将预测结果向上或向下平移,得到最终预测结果。
2.根据权利要求1所述的一种基于指数平滑的时序数据预测方法,其特征是,所述子模型的周期包括1个月、3个月、6个月和12个月。
3.根据权利要求1或2所述的一种基于指数平滑的时序数据预测方法,其特征是,所述指数平滑模型为三次指数平滑模型。
4.根据权利要求2所述的一种基于指数平滑的时序数据预测方法,其特征是,所述子模型在每个月的月初进行训练。
5.根据权利要求2所述的一种基于指数平滑的时序数据预测方法,其特征是,所述S2具体包括以下步骤:
S201,对获得的历史数据进行预处理,并将历史数据拆分为训练数据、验证数据和测试数据;
S202,使用趋势分析算法获得训练数据总体趋势,将总体趋势和训练数据作为指数平滑的参数训练模型;
S203,对指数平滑的参数训练模型进行训练,得到预测结果和初步平移变量;
S204,用验证数据来平移优化预测结果的加权目标函数,并用测试数据来测试优化后的效果,若优化后的评价指标整体比优化前的评价指标好,则保存预测结果的优化平移变量,若优化后的评价指标整体比优化后的评价指标差,则将优化平移变量置0并保存。
6.根据权利要求5所述的一种基于指数平滑的时序数据预测方法,其特征是,所述S201具体包括以下步骤:
S211,剔除异常数据,将数据处理分为以12个月开始的、4个不同周期性长度的四十八个子数据,所述4个不同周期性长度包括1个月、3个月、6个月和12个月;
S212,数据以年为单位按一定比例拆分为训练数据、验证数据、测试数据。
7.根据权利要求2所述的一种基于指数平滑的时序数据预测方法,其特征是,所述S4具体包括以下步骤:判断未来日期是否在本月月初加上1个月范围之内,若是则选用周期长度为1个月的子模型;若否,判断未来日期是否在本月月初加上3个月范围之内,若是则选用周期长度为3个月的子模型;若否,判断未来日期是否在本月月初加上6个月范围之内,若是则选用周期长度为6个月的子模型;若否,则选用周期长度为12个月的子模型。
CN202111554557.6A 2021-12-17 2021-12-17 一种基于指数平滑的时序数据预测方法 Pending CN114548479A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111554557.6A CN114548479A (zh) 2021-12-17 2021-12-17 一种基于指数平滑的时序数据预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111554557.6A CN114548479A (zh) 2021-12-17 2021-12-17 一种基于指数平滑的时序数据预测方法

Publications (1)

Publication Number Publication Date
CN114548479A true CN114548479A (zh) 2022-05-27

Family

ID=81670487

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111554557.6A Pending CN114548479A (zh) 2021-12-17 2021-12-17 一种基于指数平滑的时序数据预测方法

Country Status (1)

Country Link
CN (1) CN114548479A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116663752A (zh) * 2023-07-31 2023-08-29 山东省地质测绘院 一种基于大数据分析的地质灾害智能预警系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845669A (zh) * 2016-12-12 2017-06-13 国网上海市电力公司 基于指数平滑法预测电网年持续负荷的方法
CN110648007A (zh) * 2018-06-26 2020-01-03 中国电力科学研究院有限公司 一种降雨预报指数校正方法和系统
CN111695791A (zh) * 2020-05-29 2020-09-22 腾讯科技(深圳)有限公司 一种业务指标预测方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845669A (zh) * 2016-12-12 2017-06-13 国网上海市电力公司 基于指数平滑法预测电网年持续负荷的方法
CN110648007A (zh) * 2018-06-26 2020-01-03 中国电力科学研究院有限公司 一种降雨预报指数校正方法和系统
CN111695791A (zh) * 2020-05-29 2020-09-22 腾讯科技(深圳)有限公司 一种业务指标预测方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116663752A (zh) * 2023-07-31 2023-08-29 山东省地质测绘院 一种基于大数据分析的地质灾害智能预警系统
CN116663752B (zh) * 2023-07-31 2023-10-10 山东省地质测绘院 一种基于大数据分析的地质灾害智能预警系统

Similar Documents

Publication Publication Date Title
CN109615226B (zh) 一种运营指标异常监测方法
CN110969290B (zh) 一种基于深度学习的径流概率预测方法及系统
CN110084271B (zh) 一种图片类别的识别方法和装置
CN111210093B (zh) 基于大数据的日用水量预测方法
CN111639783A (zh) 一种基于lstm神经网络的线损预测方法及系统
CN114154716B (zh) 一种基于图神经网络的企业能耗预测方法及装置
CN114462718A (zh) 基于时间滑动窗口的cnn-gru风电功率预测方法
CN114330934A (zh) 一种模型参数自适应的gru新能源短期发电功率预测方法
CN112308298B (zh) 一种面向半导体生产线的多场景性能指标预测方法及系统
CN111737249A (zh) 基于Lasso算法的异常数据检测方法及装置
CN112381664A (zh) 电网短期负荷预测方法、预测装置及存储介质
CN111709569A (zh) 风电场输出功率预测修正方法及装置
CN115375014A (zh) 一种源荷组合概率预测方法、装置及存储介质
CN114548479A (zh) 一种基于指数平滑的时序数据预测方法
CN109523077A (zh) 一种风电功率预测方法
CN114971090A (zh) 一种电供暖负荷预测方法、系统、设备和介质
CN116663746A (zh) 一种电力负荷预测方法、装置、计算机设备及存储介质
CN115115107A (zh) 光伏功率的预测方法、预测装置和计算机设备
CN110196456A (zh) 一种基于相似年灰色关联分析的中长期降雨径流预报方法
CN110929922A (zh) 一种基于时间序列数据的指标趋势预测方法及装置
CN114581119A (zh) 流量预测方法以及装置
CN112232570A (zh) 一种正向有功总电量预测方法、装置及可读存储介质
CN117056021A (zh) 基于长时间序列预测的动态区间弹性扩缩容方法和系统
CN110781755A (zh) 一种建筑钢筋智能识别计量方法及系统
CN116247658A (zh) 一种基于dlrm深度学习模型的光伏发电量预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination