CN113256020A - 一种考虑多尺度时间序列的供电系统成本预测方法 - Google Patents

一种考虑多尺度时间序列的供电系统成本预测方法 Download PDF

Info

Publication number
CN113256020A
CN113256020A CN202110661228.5A CN202110661228A CN113256020A CN 113256020 A CN113256020 A CN 113256020A CN 202110661228 A CN202110661228 A CN 202110661228A CN 113256020 A CN113256020 A CN 113256020A
Authority
CN
China
Prior art keywords
prediction
data
cost
supply system
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110661228.5A
Other languages
English (en)
Other versions
CN113256020B (zh
Inventor
王海庆
蓝飞
姚日权
孙泉辉
程嵩
金绍君
费英群
方利锋
罗哲珺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Zhejiang Electric Power Co Ltd
Huzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
State Grid Zhejiang Electric Power Co Ltd
Huzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Zhejiang Electric Power Co Ltd, Huzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd filed Critical State Grid Zhejiang Electric Power Co Ltd
Priority to CN202110661228.5A priority Critical patent/CN113256020B/zh
Publication of CN113256020A publication Critical patent/CN113256020A/zh
Application granted granted Critical
Publication of CN113256020B publication Critical patent/CN113256020B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0206Price or cost determination based on market factors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种考虑多尺度时间序列的供电系统成本预测方法,包括如下步骤:S1、搜集供电系统历史成本数据降噪处理后,可视化得到训练集Tr和测试集Tx;S2、对历史成本数据按日为单位进行特征工程建设得到成本的数据结构;S3、采用Prophet模型对训练集Tr的多尺度时间序列进行平稳化处理;S4、采用LSTNet网络模型对分解后的时间序列各项进行建模并引入基于特征的注意力机制;S5、用测试集Tx对Prophet‑LSTNet组合预测模型进行可靠性验证;若可靠性不足,执行S4,若可靠性合格,执行S6;S6、得到的Prophet‑LSTM组合预测模型对供电系统成本进行预测,输出预测结果;Prophet‑LSTNet组合预测模型针对多尺度时间序列的多维成本数据预测,预测结果更加稳定可靠。

Description

一种考虑多尺度时间序列的供电系统成本预测方法
技术领域
本发明涉及大数据运算技术领域,具体的,涉及一种考虑多尺度时间序列的供电系统成本预测方法。
背景技术
随着大数据、云计算、移动互联技术的不断发展,预测企业经营目标需要涉及各种信息、数据的支撑越来越多,各种信息、数据的各种内在关联不断被探讨,对原有电力行业信息、数据量的价值发掘利用也日趋深入。在日趋多变的内外部形势发展下,运维成本作为企业的血脉,对其进行预测也日益成为电网企业财务不可或缺的决策支撑能力;根据以往的运维成本,包括人工成本、检修运维成本、营销运维成本、其他运营费用情况对未来的形式分析,实现对未来特定时间内的成本消耗的估计,它的准确预测对于国家电网对使用成本的总体把握、资金部署和投资建设等有着非常重要的意义。
目前可用于预测的数据挖掘工具有统计分析方法,如ARIMA模型、Holt-Winters模型等,然而这些传统统计方法缺少对复杂非线性系统的建模能力。随着深度学习的发展,长短期记忆网络(LSTM)模型的出现解决了这个问题,被广泛应用于销售预测、股票预测、自然语言处理等方面。然而实际上LSTM无法捕获非常长期的序列关系,因此相关研究人员设计LSTNet模型以解决此问题;但是LSTNet只能挖掘不同时段的序列特征,不能对序列噪音等进行平稳处理。
目前制约预测模型可靠性的因素有以下几个方面,一方面是当数据量很大时,构建有效的输入数据结构来刻画相应成本金额非常有必要,然而传统方法要么是选取其中少量数据维度,要么忽略已有数据之间的总体关联性质,这都导致了数据的信息缺失,使得进一步的建模受到先验限制;另一方面,基于能获取的所有数据维度,传统方法无法有效提取出其中有利于预测的高维的、相互作用的有效特征,如:时间序列模型只突出时间序列而不考虑外界因素影响,这使得利用ARIMA模型预测变化较大的成本值会出现较大偏差;这些原因导致统计预测的不精确,也就限制了传统方法的实际应用。
中国专利,公开号:CN112365086A,公开日:2021年2月12日,涉及电力成本预测技术,旨在提供一种基于LSTM优化器的电力成本预测方法。该方法包括:搜集历史电力成本数据及电力公司每日收入的日现金流数据,进行标准化预处理,准备用于训练的数据集;构建LSTM预测网络及LSTM优化器,训练并交替更新LSTM预测网络及LSTM优化器的权重参数;利用训练好的LSTM预测网络进行电力成本预测,得到预测结果。由于LSTM无法捕获非常长期的序列关系,并且选取的其中少量数据维度,忽略已有数据之间的总体关联性质,因此该方法建立的模型的可靠性较差。
发明内容
本发明的目的是解决传统预测模型对多尺度时间序列的多维数据结构预测可靠性低的问题,提出了一种考虑多尺度时间序列的供电系统成本预测方法,设计Prophet-LSTNet组合预测模型对多尺度时间序列的多维成本数据进行预测,能够反应多维数据与预测结果之间的内在联系,预测结果更加稳定可靠。
为实现上述技术目的,本发明提供的一种技术方案是,一种考虑多尺度时间序列的供电系统成本预测方法,包括如下步骤:
S1、搜集供电系统历史成本数据;对成本数据进行降噪处理后,可视化得到训练集Tr和测试集Tx;
S2、对历史成本数据按日为单位进行特征工程建设得到成本的数据结构;所述数据结构包括:日现金流、日期以及用户属性;
S3、采用Prophet模型对训练集Tr的多尺度时间序列进行平稳化处理;将原始多尺度时间序列分解成趋势项、季节项以及残差项;
S4、采用LSTNet网络模型对分解后的时间序列各项进行建模;LSTNet网络模型的输入项包括各项历史日现金流序列以及对应的用户属性数据,引入基于特征的注意力机制;训练并交替更新LSTNet网络模型的权重参数;
S5、用测试集Tx对训练完成的 Prophet-LSTNet组合预测模型进行可靠性验证;若可靠性不足,执行S4,若可靠性合格,执行S6;可靠性验证包括如下子步骤:
S51、采用测试集Tx内的跟随时间序列的用户属性数据作为Prophet-LSTNet组合预测模型的输入,生成跟随时间序列上的预测结果;预测结果可视化后制作预测曲线图,对预测曲线图围成的区域按时间区段进行切割成m份,分别计算每一份区域的面积a;
S52、测试集Tx可视化后经过平滑处理得到测试曲线图,采用S5中相同的切割方式对测试曲线图进行切割成m份,分别计算每一份区域的面积b;
S53、对应时间区间上的区域面积进行误差运算得到m个局部拟合优度值d;
S54、与预设的拟合优度值d0进行比较运算确定局部拟合优度值的合格率H,根据局部拟合优度值的合格率确定Prophet-LSTNet组合预测模型是否可靠;
S6、利用训练好的Prophet-LSTM组合预测模型对供电系统成本进行预测,输出预测结果。
本方案中,获取历史成本数据对数据进行预处理后可视化数据,得到训练集Tr和测试集Tx,建立数据结构,找到数据内各维度数据之间的相关性,通过Prophet模型对训练集Tr的多时间序列进行分解,分离出反应不同时间特性的特征项,包括:趋势项、季节项以及残差项,采用LSTNet网络模型对分解后的时间序列各项进行建模,LSTNet网络模型的输入包括三个时间维度的数据,每一个时间维度的数据包括有日现金流序列以及对应的用户属性数据,并且引入注意力机制,在关键部分注入更多的精力资源以取得更详细信息,同时忽视其他无用信息,能够帮助模型快速获得与目标任务有关的核心信息,自适应地提取每个时刻的相关特征以提高模型的工作效率与准确性;模型训练完成后,需要对模型的可靠性进行验证,防止预测模型陷入局部最优,对最优模型预测的时间序列结果进行切割,分别与测试集Tx对应时间区间内的值比对计算其拟合优度值,根据优度值占全局优度值的合格率,确定最优模型是否可靠,该方法可以最大限度的提高预测模型的可靠性。
作为优选,S1中对成本数据进行降噪处理包括如下步骤:
以时间间隔t1为周期对历史成本数据进行划分成n等份,剔除成本数据中的负值, 将每一等份的历史成本数据根据数值排序分为四等分,计算第一四分位数Q1和第二四分位 数Q2以及第三四分位数Q3,异常值是位于四分位数范围之外的数据点,设定异常值的边界 范围,其中异常值上限:
Figure 507519DEST_PATH_IMAGE001
异常值下限:
Figure 831184DEST_PATH_IMAGE002
其中:
Figure 142080DEST_PATH_IMAGE003
Figure 193081DEST_PATH_IMAGE004
其中,
Figure 273033DEST_PATH_IMAGE005
,k为置信系数;其中超过异常值上限的数据使用异常值上限
Figure 626654DEST_PATH_IMAGE006
代 替,低于异常值下限的数据使用异常值
Figure 300211DEST_PATH_IMAGE007
下限代替。
作为优选,可视化成本数据包括如下步骤:
建立笛卡尔坐标系,其中横轴为时间值,纵轴为成本值;分别对训练集Tr和测试集Tx绘制时间序列上的成本折线图。根据折线图可以更加直观的看到时间数据序列的变化趋势。
作为优选,S2中用户属性包括有用户的评估分布、行业分布、用电量分布以及支付分布;
定义:
评估分布:根据用户支付时间位于最小至最大到账日期闭区间的位置分为A个区间;
行业分布:根据用户所在地从事的行业区分为B个区间;
用电量分布:根据用户的用电量划分为C个区间;
支付分布:将用户支付金额划分为D个区间;
日现金流占用一个区间,日期占用E个区间,因此数据结构为(1+A+B+C+D+E)维数据。
本方案中,统计供电系统中每日缴费用户中各类别所占比例,综合往期信息,得到用户群体的特征分布,主要包括的用户特征包括有评估分布、行业分布、用电量分布以及支付分布,将所有数据按时间分类,以天为单位,其中每一天的特征包含单日现金流、当日对应周几以及相应月份、当日缴费的各种用户类别占比分布;使用定义的数据结构,尽可能多地保留数据中的有效信息,从而使预测更加准确。
作为优选,S3中,采用STL时间序列分解算法将原始序列数据分为趋势项
Figure 30270DEST_PATH_IMAGE008
、季 节项
Figure 121985DEST_PATH_IMAGE009
以及残差项
Figure 521874DEST_PATH_IMAGE010
;其时间序列预测结果采用如下公式表示:
模型公式如下:
Figure 541782DEST_PATH_IMAGE011
本方案中,对于趋势预测,数据生成过程的核心组成部分是一个模型,用于说明序列如何变化以及预计如何继续变化;这种建模方式与社会人口增长相似,增长到一定程度后社会承受能力抵达饱和状态;通常使用逻辑增长模型对这种趋势进行建模,它的基本形式如下:
Figure 809952DEST_PATH_IMAGE012
其中,C代表承载容量,k代表增长率,m表示曲线的中点;
对于季节项,通过傅立叶级数来模拟灵活的周期效应模型,假设序列拥有周期 P(如果数据以天为单位, 则年度数据 P = 365.25,周度数据 P = 7), 使用傅立叶级数逼近任意平滑的季节性效应:公式如下:
Figure 723551DEST_PATH_IMAGE013
其中,
Figure 684554DEST_PATH_IMAGE014
为余弦的傅里叶系数,
Figure 332704DEST_PATH_IMAGE015
为正弦的傅里叶系数。
作为优选,S4中,训练并交替更新LSTNet网络模型的权重参数包括如下步骤:
根据历史成本数据量按3:1的占比划分训练集Tr和测试集Tx;
用网格法对LSTNet网络模型的超参数进行遍历;超参数包括往期天数、网络层数、学习率、迭代算法及迭代次数;
遍历结束,记录最优超参数,建立最优模型。
作为优选,S51包括如下步骤:
测试集Tx的用户属性数据跟随时间序列作为Prophet-LSTNet组合预测模型的输入,输出时间序列上的预测结果;
预测结果可视化后经过平滑处理得到预测曲线图,以时间间隔t2为周期对预测曲线图切割成m份;
分别计算时间间隔t2与其对应的预测曲线所围成的图形面积a生成面积序列A,记做A=[a1,a2,···,am]。
作为优选,S52包括如下步骤:
测试集Tx可视化后经过平滑处理得到测试曲线图,以时间间隔t2为周期对测试曲线图进行切割成m份;
计算时间间隔t2与其对应的测试曲线所围成的图形面积b生成面积序列A,记做B=[b1,b2,···,bm]。
作为优选,S53包括如下步骤:
局部拟合优度值d,计算公式如下:
Figure 138986DEST_PATH_IMAGE016
,生成局部拟合优度值序列D=[d1,d2,···,dm]。
作为优选,S54包括如下步骤:
拟合优度值序列D内拟合优度值分别与设定的拟合优度值d0进行比较得到状况表 F;状况表F中的取值为m位二进制数,其中,
Figure 939714DEST_PATH_IMAGE017
记为0;
Figure 540459DEST_PATH_IMAGE018
记为1;
通过状况表F中“1”的占位比例计算合格率H,若合格率
Figure 800539DEST_PATH_IMAGE019
,则判定最优模型 可靠;若合格率
Figure 285878DEST_PATH_IMAGE020
,则判定最优模型不可靠。
本方案中,为了防止最优预测模型陷入局部最优,对预测后的时间序列数据可视化后按时间间隔进行切割,分别对切割后的数据进行对比计算拟合优度值,通过计算合格拟合优度值占全局拟合优度值的比例,确定最优预测模型是否可靠;其中,拟合最优度计算方式摒弃了传统的最小二乘法计算残差平方的方式(通过点对点的计算规则),取时间区间以及对应的曲线围成的不规则多边形面积,通过在时间上对曲线进行积分即可得到占用面积a和b,拟合优度值d=(b-a)/b,将d与预设的拟合优度值d0进行比较即可判定该区段的预测值是否合格,通过面积对比法比点对点对比法的健壮性更强,容错性更高,对时间序列进行切割,分段计算拟合优度值,然后全局考虑拟合优度值的合格率,明显提高了预测模型的鲁棒性和可靠性。
本发明的有益效果:
1、设计了一种考虑多尺度时间序列的供电系统成本预测方法,相比传统的基于供电所运维成本曲线趋势预测更加准确、合理,准确度有所提升;构建的深度学习模型相比传统统计模型可以较少的人工干预,结果更加鲁棒,更适应大数据,并可以自动学习出、提取出有价值的特征组合,有利于找到销售市场的规律;
2、该模型创造性地结合了统计模型的可解释性和神经网络模型对复杂非线性系统的建模能力,可以有效地预测有噪声的非平稳时间序列,提高了时间序列模型的预测能力和预测精度;
3、设计了最优预测模型可靠性验证方法,采用局部计算的面积比对法计算拟合优度值,根据合格的拟合优度值占全局拟合优度值的比例,确定最优预测模型是否可靠,避免了模型陷入局部最优,明显提高了预测模型的鲁棒性和可靠性。
附图说明
图1为本发明的一种考虑多尺度时间序列的供电系统成本预测方法的流程图。
图2为本发明Prophet-LSTNet组合预测模型框架图。
具体实施方式
为使本发明的目的、技术方案以及优点更加清楚明白,下面结合附图和实施例对本发明作进一步详细说明,应当理解的是,此处所描述的具体实施方式仅是本发明的一种最佳实施例,仅用以解释本发明,并不限定本发明的保护范围,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例:如图1所示,一种考虑多尺度时间序列的供电系统成本预测方法,包括如下步骤:
S1、搜集供电系统历史成本数据;对成本数据进行降噪处理后,对数据进行切割划分得到训练集Tr和测试集Tx,建立笛卡尔坐标系,其中横轴为时间值,纵轴为成本值;分别对训练集Tr和测试集Tx绘制时间序列上的成本折线图。根据折线图可以更加直观的看到时间数据序列的变化趋势;
其中,对成本数据进行降噪处理包括如下步骤:
以时间间隔t1为周期对历史成本数据进行划分成n等份,剔除成本数据中的负值, 将每一等份的历史成本数据根据数值排序分为四等分,计算第一四分位数Q1和第二四分位 数Q2以及第三四分位数Q3,异常值是位于四分位数范围之外的数据点,设定异常值的边界 范围,其中异常值上限:
Figure 315014DEST_PATH_IMAGE001
异常值下限:
Figure 8033DEST_PATH_IMAGE002
其中:
Figure 365196DEST_PATH_IMAGE021
Figure 513280DEST_PATH_IMAGE004
其中,
Figure 396923DEST_PATH_IMAGE005
,k为置信系数;其中超过异常值上限的数据使用异常值上限
Figure 231149DEST_PATH_IMAGE006
代 替,低于异常值下限的数据使用异常值
Figure 200242DEST_PATH_IMAGE007
下限代替。
S2、对历史成本数据按日为单位进行特征工程建设得到成本的数据结构;所述数据结构包括:日现金流、日期以及用户属性;用户属性包括有用户的评估分布、行业分布、用电量分布以及支付分布。
定义:
评估分布:根据用户支付时间位于最小至最大到账日期闭区间的位置分为A个区间;
行业分布:根据用户所在地从事的行业区分为B个区间;
用电量分布:根据用户的用电量划分为C个区间;
支付分布:将用户支付金额划分为D个区间;
日现金流占用一个区间,日期占用E个区间,因此数据结构为(1+A+B+C+D+E)维数据。
一种适用于本实施例的具体事例如下:
成本的数据结构如表1所示,共35维,为依次拼接的1维日现金流金额估计和29维的用户属性特征以及5维的日期时间特征。其中用户特征包括四类分类变量特征:
评估分布:支付时间位于最小至最大到账日期闭区间之内,记为0;小于最小到账日期, 记为 1;大于最大到账日期,记为 2,从而对电力系统的入账能力情况进行评估;
行业分布:高压电用户一共从事九大行业,按照预先设定的排序,某一用户的这一特征,定义为行业在此排序中的序号,值为 0, 1, ..., 8;
用电量分布:为了考察预计到账日当天对应的用户组的用电量分布,取预计到账日的上一个月作为“年月”日期标签,找到对应用户的用电量,根据用电量的多少划分为九个区间,从而定义该用户的这一特征的值为0, 1,···, 8;
支付金额:将用户支付金额划分为八个区间,从而定义该用户的这一特征的值为0, 1, ..., 7;
由于,供电系统的营销成本用日现金流进行量化,该用户特征估计方案结合了月用电量和日现金流的多模态信息,最大程度保证了样本信息的有效性和正则性;由于季节、工作日和休息日以及传统假日会对用电量产生很大的影响,时间特征必须被纳入到数据结构中,需要对时间特征的每一维进行归一化处理。
表1:成本的数据结构
Figure 27384DEST_PATH_IMAGE023
本实施例中,统计供电系统中每日缴费用户中各类别所占比例,综合往期信息,得到用户群体的特征分布,主要包括的用户特征包括有评估分布、行业分布、用电量分布以及支付分布,将所有数据按时间分类,以天为单位,其中每一天的特征包含单日现金流、当日对应周几以及相应月份、当日缴费的各种用户类别占比分布;使用定义的数据结构,尽可能多地保留数据中的有效信息,从而使预测更加准确。
如图2所示,S3、采用Prophet模型对训练集Tr的多尺度时间序列进行平稳化处理;将原始多尺度时间序列分解成趋势项、季节项以及残差项;
采用STL时间序列分解算法将原始序列数据分为趋势项
Figure 31112DEST_PATH_IMAGE024
、季节项
Figure 800353DEST_PATH_IMAGE025
以及残 差项
Figure 991163DEST_PATH_IMAGE026
;其时间序列预测结果采用如下公式表示:
模型公式如下:
Figure 746630DEST_PATH_IMAGE027
本实施例中,对于趋势预测,数据生成过程的核心组成部分是一个模型,用于说明序列如何变化以及预计如何继续变化;这种建模方式与社会人口增长相似,增长到一定程度后社会承受能力抵达饱和状态;通常使用逻辑增长模型对这种趋势进行建模,它的基本形式如下:
Figure 214651DEST_PATH_IMAGE028
其中,C代表承载容量,k代表增长率,m表示曲线的中点;
对于季节项,通过傅立叶级数来模拟灵活的周期效应模型,假设序列拥有周期 P(如果数据以天为单位, 则年度数据 P = 365.25,周度数据 P = 7), 使用傅立叶级数逼近任意平滑的季节性效应:公式如下:
Figure 30161DEST_PATH_IMAGE029
其中,
Figure 865524DEST_PATH_IMAGE014
为余弦的傅里叶系数,
Figure 300047DEST_PATH_IMAGE015
为正弦的傅里叶系数。
S4、采用LSTNet网络模型对分解后的时间序列各项进行建模;LSTNet网络模型的输入项包括各项历史日现金流序列以及对应的用户属性数据,引入基于特征的注意力机制;训练并交替更新LSTNet网络模型的权重参数;包括如下步骤:
根据历史成本数据量按3:1的占比划分训练集Tr和测试集Tx;
用网格法对LSTNet网络模型的超参数进行遍历;超参数包括往期天数、网络层数、学习率、迭代算法及迭代次数;
遍历结束,记录最优超参数,建立最优模型。
本实施例中,LSTNet网络模型利用卷积层的优势来发现局部多维输入变量和循环层之间的依赖关系模式,以捕获复杂的长期依赖关系,它通过一种新颖的递归结构(即递归跳跃)来捕获非常长期的依赖模式,并利用输入时间序列信号的周期性来简化优化过程,最后,LSTNet结合了与非线性神经网络部分(即趋势项)并行的传统自回归线性模型,这使得非线性深度学习模型对于违反尺度变化的时间序列更具鲁棒性。
S5、用测试集Tx对 Prophet-LSTNet组合预测模型进行可靠性验证;若可靠性不足,执行S4,若可靠性合格,执行S6;
采用测试集Tx对训练完成的最优模型进行可靠性验证包括如下步骤:
测试集Tx的时间序列内包含的用户属性数据作为Prophet-LSTNet组合预测模型的输入,输出预测结果;
预测结果可视化后经过平滑处理得到预测曲线图,以时间间隔t(可以为一周,一月或者一个季度,时间间隔越长,其最终得到的最优预测模型的健壮性越强)为周期对预测曲线图切割成m份;
分别计算时间间隔t与其对应的曲线所围成的图形面积a生成面积序列A,记做A=[a1,a2,···,am];
测试集Tx可视化后经过平滑处理得到测试曲线图,以时间间隔t为周期对测试曲线图进行切割成m份;
计算时间间隔t与其对应的曲线所围成的图形面积b生成面积序列A,记做B=[b1,b2,···,bm];
计算局部拟合优度值d,计算公式为:
Figure 12788DEST_PATH_IMAGE030
;生成局部拟合优度值序列D=[d1, d2,···,dm];
拟合优度值序列D内的拟合优度值分别与设定的拟合优度值d0进行比较得到状况 表F;状况表F中的取值为m位二进制数,其中,
Figure 858253DEST_PATH_IMAGE031
记为0;
Figure 23655DEST_PATH_IMAGE018
记为1;
通过状况表F中“1”的占位比例计算合格率H,若“1”的占位有m1个,则合格率H=m1/ m,若合格率
Figure 120924DEST_PATH_IMAGE032
,则判定最优模型可靠;若合格率
Figure 563538DEST_PATH_IMAGE033
,则判定最优模型不可靠。
本实施例中,为了防止最优预测模型陷入局部最优,对预测后的时间序列数据可视化后按时间间隔进行切割,分别对切割后的数据进行对比计算拟合优度值,通过计算合格拟合优度值占全局拟合优度值的比例,确定最优预测模型是否可靠;其中,拟合最优度计算方式摒弃了传统的最小二乘法计算残差平方的方式(通过点对点的计算规则),取时间区间以及对应的曲线围成的不规则多边形面积,通过在时间上对曲线进行积分即可得到占用面积a和b,拟合优度值d=(b-a)/b,将d与预设的拟合优度值d0进行比较即可判定该区段的预测值是否合格,通过面积对比法比点对点对比法的健壮性更强,容错性更高,对时间序列进行切割,分段计算拟合优度值,然后全局考虑拟合优度值的合格率,明显提高了预测模型的鲁棒性和可靠性。
S6、利用训练好的Prophet-LSTM组合预测模型对供电系统成本进行预测,输出预测结果。
本实施例的原理如下:获取历史成本数据对数据进行预处理后可视化数据,得到训练集Tr和测试集Tx,建立数据结构,找到数据内各维度数据之间的相关性,通过Prophet模型对训练集Tr的多时间序列进行分解,分离出反应不同时间特性的特征项,包括:趋势项、季节项以及残差项,采用LSTNet网络模型对分解后的时间序列各项进行建模,LSTNet网络模型的输入包括三个时间维度的数据,每一个时间维度的数据包括有日现金流序列以及对应的用户属性数据,并且引入注意力机制,在关键部分注入更多的精力资源以取得更详细信息,同时忽视其他无用信息,能够帮助模型快速获得与目标任务有关的核心信息,自适应地提取每个时刻的相关特征以提高模型的工作效率与准确性;模型训练完成后,需要对模型的可靠性进行验证,防止预测模型陷入局部最优,对最优模型预测的时间序列结果进行切割,分别与测试集Tx对应时间区间内的值比对计算其拟合优度值,根据优度值占全局优度值的合格率,确定最优模型是否可靠,该方法可以最大限度的提高预测模型的可靠性。
以上所述之具体实施方式为本发明一种考虑多尺度时间序列的供电系统成本预测方法的较佳实施方式,并非以此限定本发明的具体实施范围,本发明的范围包括并不限于本具体实施方式,凡依照本发明之形状、结构所作的等效变化均在本发明的保护范围内。

Claims (10)

1.一种考虑多尺度时间序列的供电系统成本预测方法,其特征在于:包括如下步骤:
S1、搜集供电系统历史成本数据;对成本数据进行降噪处理后,可视化得到训练集Tr和测试集Tx;
S2、对历史成本数据按日为单位进行特征工程建设得到成本的数据结构;所述数据结构包括:日现金流、日期以及用户属性;
S3、采用Prophet模型对训练集Tr的多尺度时间序列进行平稳化处理;将原始多尺度时间序列分解成趋势项、季节项以及残差项;
S4、采用LSTNet网络模型对分解后的时间序列各项进行建模;LSTNet网络模型的输入项包括各项历史日现金流序列以及对应的用户属性数据,引入基于特征的注意力机制;训练并交替更新LSTNet网络模型的权重参数;
S5、用测试集Tx对训练完成的 Prophet-LSTNet组合预测模型进行可靠性验证;若可靠性不足,执行S4,若可靠性合格,执行S6;可靠性验证包括如下子步骤:
S51、采用测试集Tx内的跟随时间序列的用户属性数据作为Prophet-LSTNet组合预测模型的输入,生成跟随时间序列上的预测结果;预测结果可视化后制作预测曲线图,对预测曲线图围成的区域按时间区段进行切割成m份,分别计算每一份区域的面积a;
S52、测试集Tx可视化后经过平滑处理得到测试曲线图,采用S5中相同的切割方式对测试曲线图进行切割成m份,分别计算每一份区域的面积b;
S53、对应时间区间上的区域面积进行误差运算得到m个局部拟合优度值d;
S54、与预设的拟合优度值d0进行比较运算确定局部拟合优度值的合格率H,根据局部拟合优度值的合格率确定Prophet-LSTNet组合预测模型是否可靠;
S6、利用训练好的Prophet-LSTM组合预测模型对供电系统成本进行预测,输出预测结果。
2.根据权利要求1所述的一种考虑多尺度时间序列的供电系统成本预测方法,其特征在于:S1中对成本数据进行降噪处理包括如下步骤:
以时间间隔t1为周期对历史成本数据进行划分成n等份,剔除成本数据中的负值,将每 一等份的历史成本数据根据数值排序分为四等分,计算第一四分位数Q1和第二四分位数Q2 以及第三四分位数Q3,异常值是位于四分位数范围之外的数据点,设定异常值的边界范围, 其中异常值上限:
Figure 951763DEST_PATH_IMAGE001
异常值下限:
Figure 400062DEST_PATH_IMAGE002
其中:
Figure 976537DEST_PATH_IMAGE003
Figure 902905DEST_PATH_IMAGE004
其中,
Figure 451698DEST_PATH_IMAGE005
,k为置信系数;其中超过异常值上限的数据使用异常值上限
Figure 572363DEST_PATH_IMAGE006
代替, 低于异常值下限的数据使用异常值
Figure DEST_PATH_IMAGE007
下限代替。
3.根据权利要求1所述的一种考虑多尺度时间序列的供电系统成本预测方法,其特征在于:可视化成本数据包括如下步骤:
建立笛卡尔坐标系,其中横轴为时间值,纵轴为成本值;分别对训练集Tr和测试集Tx绘制时间序列上的成本折线图。
4.根据权利要求2所述的一种考虑多尺度时间序列的供电系统成本预测方法,其特征在于:
S2中用户属性包括有用户的评估分布、行业分布、用电量分布以及支付分布;
定义:
评估分布:根据用户支付时间位于最小至最大到账日期闭区间的位置分为A个区间;
行业分布:根据用户所在地从事的行业区分为B个区间;
用电量分布:根据用户的用电量划分为C个区间;
支付分布:将用户支付金额划分为D个区间;
日现金流占用一个区间、日期占用E个区间,因此数据结构为(1+A+B+C+D+E)维数据。
5.根据权利要求1所述的一种考虑多尺度时间序列的供电系统成本预测方法,其特征在于:
S3中,采用STL时间序列分解算法将原始序列数据分为趋势项
Figure 104975DEST_PATH_IMAGE008
、季节项
Figure 100613DEST_PATH_IMAGE009
以及 残差项
Figure 300650DEST_PATH_IMAGE010
;其时间序列预测结果采用如下公式表示:
模型公式如下:
Figure 28435DEST_PATH_IMAGE011
6.根据权利要求1或4或5所述的一种考虑多尺度时间序列的供电系统成本预测方法,其特征在于:
S4中,训练并交替更新LSTNet网络模型的权重参数包括如下步骤:
根据历史成本数据量按3:1的占比划分训练集Tr和测试集Tx;
用网格法对LSTNet网络模型的超参数进行遍历;超参数包括往期天数、网络层数、学习率、迭代算法及迭代次数;
遍历结束,记录最优超参数,建立最优模型。
7.根据权利要求1所述的一种考虑多尺度时间序列的供电系统成本预测方法,其特征在于: S51包括如下步骤:
测试集Tx的用户属性数据跟随时间序列作为Prophet-LSTNet组合预测模型的输入,输出时间序列上的预测结果;
预测结果可视化后经过平滑处理得到预测曲线图,以时间间隔t2为周期对预测曲线图切割成m份;
分别计算时间间隔t2与其对应的预测曲线所围成的图形面积a生成面积序列A,记做A=[a1,a2,···,am]。
8.根据权利要求7所述的一种考虑多尺度时间序列的供电系统成本预测方法,其特征在于: S52包括如下步骤:
测试集Tx可视化后经过平滑处理得到测试曲线图,以时间间隔t2为周期对测试曲线图进行切割成m份;
计算时间间隔t2与其对应的测试曲线所围成的图形面积b生成面积序列A,记做B=[b1,b2,···,bm]。
9.根据权利要求8所述的一种考虑多尺度时间序列的供电系统成本预测方法,其特征在于:S53包括如下步骤:
局部拟合优度值d,计算公式如下:
Figure 579502DEST_PATH_IMAGE012
,生成局部拟合优度值序列D=[d1,d2,···,dm]。
10.根据权利要求9所述的一种考虑多尺度时间序列的供电系统成本预测方法,其特征在于:S54包括如下步骤:
拟合优度值序列D内拟合优度值分别与设定的拟合优度值d0进行比较得到状况表F;状 况表F中的取值为m位二进制数,其中
Figure 847672DEST_PATH_IMAGE013
,记为0;
Figure 105478DEST_PATH_IMAGE014
记为1;
通过状况表F中“1”的占位比例计算合格率H,若合格率
Figure 332060DEST_PATH_IMAGE015
,则判定最优模型可靠; 若合格率
Figure 104844DEST_PATH_IMAGE016
,则判定最优模型不可靠。
CN202110661228.5A 2021-06-15 2021-06-15 一种考虑多尺度时间序列的供电系统成本预测方法 Active CN113256020B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110661228.5A CN113256020B (zh) 2021-06-15 2021-06-15 一种考虑多尺度时间序列的供电系统成本预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110661228.5A CN113256020B (zh) 2021-06-15 2021-06-15 一种考虑多尺度时间序列的供电系统成本预测方法

Publications (2)

Publication Number Publication Date
CN113256020A true CN113256020A (zh) 2021-08-13
CN113256020B CN113256020B (zh) 2021-10-08

Family

ID=77187925

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110661228.5A Active CN113256020B (zh) 2021-06-15 2021-06-15 一种考虑多尺度时间序列的供电系统成本预测方法

Country Status (1)

Country Link
CN (1) CN113256020B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113688125A (zh) * 2021-08-24 2021-11-23 平安国际智慧城市科技股份有限公司 基于人工智能的异常值检测方法、装置、电子设备及介质
CN114756604A (zh) * 2022-06-13 2022-07-15 西南交通大学 一种基于Prophet组合模型的监测时序数据预测方法
CN115049161A (zh) * 2022-08-12 2022-09-13 深圳市深信信息技术有限公司 基于云计算的智能农贸市场管理方法及处理器
CN116862077A (zh) * 2023-08-31 2023-10-10 吉林电力交易中心有限公司 基于多模态组合模型的电采暖运行成本预测方法和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112365086A (zh) * 2020-11-26 2021-02-12 国网浙江省电力有限公司 基于lstm优化器的电力标准成本预测方法
CN112396225A (zh) * 2020-11-13 2021-02-23 浙江电力交易中心有限公司 一种基于长短期记忆网络的短期电价预测方法
CN112785042A (zh) * 2020-12-31 2021-05-11 国网山东省电力公司菏泽供电公司 基于Prophet-LSTM组合算法的配电变压器重过载预测方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112396225A (zh) * 2020-11-13 2021-02-23 浙江电力交易中心有限公司 一种基于长短期记忆网络的短期电价预测方法
CN112365086A (zh) * 2020-11-26 2021-02-12 国网浙江省电力有限公司 基于lstm优化器的电力标准成本预测方法
CN112785042A (zh) * 2020-12-31 2021-05-11 国网山东省电力公司菏泽供电公司 基于Prophet-LSTM组合算法的配电变压器重过载预测方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵英等: "基于LSTM⁃Prophet 非线性组合的时间序列预测模型", 《计算机与现代化》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113688125A (zh) * 2021-08-24 2021-11-23 平安国际智慧城市科技股份有限公司 基于人工智能的异常值检测方法、装置、电子设备及介质
CN113688125B (zh) * 2021-08-24 2023-12-05 平安国际智慧城市科技股份有限公司 基于人工智能的异常值检测方法、装置、电子设备及介质
CN114756604A (zh) * 2022-06-13 2022-07-15 西南交通大学 一种基于Prophet组合模型的监测时序数据预测方法
CN115049161A (zh) * 2022-08-12 2022-09-13 深圳市深信信息技术有限公司 基于云计算的智能农贸市场管理方法及处理器
CN116862077A (zh) * 2023-08-31 2023-10-10 吉林电力交易中心有限公司 基于多模态组合模型的电采暖运行成本预测方法和介质

Also Published As

Publication number Publication date
CN113256020B (zh) 2021-10-08

Similar Documents

Publication Publication Date Title
CN113256020B (zh) 一种考虑多尺度时间序列的供电系统成本预测方法
Borgonovo Sensitivity analysis: an introduction for the management scientist
Dupačová et al. Scenarios for multistage stochastic programs
Baker et al. Robust portfolio decision analysis: An application to the energy research and development portfolio problem
CN113298288A (zh) 一种融合时间序列和神经网络的供电所运维成本预测方法
CN113256036B (zh) 基于Prophet-LSTNet组合模型的供电成本分析预测方法
Tung et al. Binary classification and data analysis for modeling calendar anomalies in financial markets
CN114912787A (zh) 一种企业危险废物瞒报漏报风险的智能评估方法
Saxena et al. Comprehensive study of machine learning algorithms for stock market prediction during COVID-19
Yu et al. A case-based reasoning driven ensemble learning paradigm for financial distress prediction with missing data
CN114548494B (zh) 一种可视化造价数据预测智能分析系统
CN109345021A (zh) 一种采用lstm建模预测劳动力需求增量的方法
Kacprzyk et al. On some types of linguistic summaries of time series
Ovcharenko et al. Economic security of regions: A methodological approach to assessment, management, and legal regulation
Hu Analysis of enterprise financial and economic impact based on background deep learning model under business administration
Chupilko et al. Python for data processing and modeling indicators of economic security of the country
Khandelwal et al. Financial Data Time Series Forecasting Using Neural Networks and a Comparative Study
Boguhn Forecasting power consumption of manufacturing industries using neural networks
Yang et al. Housing price mathematical prediction method through Big Data analysis and improved linear regression model
Li et al. Prediction and Sensitivity Analysis of Companies’ Return on Equity Based on Deep Neural Network
Judijanto et al. Trends and Evolution of Data-Driven Financial Management: A Bibliometric Analysis of Scientific Publications and Their Influence on Financial Decision Making
Ma et al. An engineering approach to forecast volatility of financial indices
Yu et al. A method for detecting outliers in functional data
Şenaras A Suggestion for Energy Policy Planning System Dynamics
Khalid Forecasting neural networks, such as forecasting sale the plastic injection machine market

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant