CN116681147A - 电能需量预测方法和相关设备 - Google Patents

电能需量预测方法和相关设备 Download PDF

Info

Publication number
CN116681147A
CN116681147A CN202210155723.3A CN202210155723A CN116681147A CN 116681147 A CN116681147 A CN 116681147A CN 202210155723 A CN202210155723 A CN 202210155723A CN 116681147 A CN116681147 A CN 116681147A
Authority
CN
China
Prior art keywords
target
factor
factors
electric energy
energy demand
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210155723.3A
Other languages
English (en)
Inventor
薛未业
孙越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Shanghai ICT Co Ltd
CM Intelligent Mobility Network Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Shanghai ICT Co Ltd
CM Intelligent Mobility Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Shanghai ICT Co Ltd, CM Intelligent Mobility Network Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202210155723.3A priority Critical patent/CN116681147A/zh
Publication of CN116681147A publication Critical patent/CN116681147A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Operations Research (AREA)
  • Primary Health Care (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Biomedical Technology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种电能需量预测方法和相关设备,属于企业能耗管理技术领域。其中,方法包括:获取电能需量对应的至少两个影响因素在第一预设时间长度内的目标数据;在所述目标数据存在缺失的情况下,利用预先训练的生成对抗网络GAN模型生成填充数据;将所述填充数据和所述目标数据输入至预先建立并训练的长短期记忆LSTM预测模型中进行电能需量预测,得到电能需量预测值;其中,所述LSTM预测模型的输入变量为目标输入因素,所述目标输入因素为所述至少两个影响因素中与所述电能需量的关联度满足预设条件的影响因素;所述LSTM预测模型的超参数通过超参数寻优确定。本发明能够提高电能需量的预测准确度。

Description

电能需量预测方法和相关设备
技术领域
本发明属于企业能耗管理技术领域,具体涉及一种电能需量预测方法和相关设备。
背景技术
为了对可控的冲击性负荷进行有效控制,约束工业类型的企业可能的超限超量耗能问题,供电公司通常会与用电需求较高的企业建立需量供电协议。需量供电协议指的是,用电企业预测下一个用电周期内自身的电能需量,并根据预测得到的最大电能需量来支付用电费用。
目前,供电企业一般是基于过往经验和历史数值,采用统计学的预测模型对下一个用电周期的电能需量进行预测。由于电能需量的影响因素种类较多且较为复杂,统计学的预测模型得到的电能需量预测结果准确度较低。
发明内容
本发明的目的是提供一种电能需量预测方法和相关设备,能够解决相关技术中的电能需量预测结果准确度较低的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明提供了一种电能需量预测方法,包括:
获取电能需量对应的至少两个影响因素在第一预设时间长度内的目标数据;
在所述目标数据存在缺失的情况下,利用预先训练的生成对抗网络GAN模型生成填充数据;
将所述填充数据和所述目标数据输入至预先建立并训练的长短期记忆LSTM预测模型中进行电能需量预测,得到电能需量预测值;
其中,所述LSTM预测模型的输入变量为目标输入因素,所述目标输入因素为所述至少两个影响因素中与所述电能需量的关联度满足预设条件的影响因素;所述LSTM预测模型的超参数通过超参数寻优确定。
可选地,所述方法还包括:
建立待训练GAN模型,其中,所述待训练GAN模型包括生成器网络和判别器网络,所述生成器网络和所述判别器网络均基于所述LSTM预测模型建立;
利用随机噪声以及所述至少两个影响因素在第二预设时间长度内的样本数据,对所述生成器网络和所述判别器网络进行迭代训练;
在所述生成器网络和所述判别器网络达到纳什平衡状态的情况下,将当次训练好的所述待训练GAN模型确定为所述GAN模型。
可选地,所述方法还包括:
基于所述至少两个影响因素在第三预设时间长度内的历史数据对所述至少两个影响因素中每个影响因素与所述电能需量进行关联度分析,确定所述至少两个影响因素中每个影响因素对应的关联度;
将所述至少两个影响因素中所述关联度满足所述预设条件的影响因素确定为目标输入因素;
建立LSTM基础模型;其中,所述LSTM基础模型的输入变量为所述目标输入因素;
对所述LSTM基础模型进行超参数寻优,获得目标超参数;
根据所述目标超参数更新所述LSTM基础模型,得到LSTM预测模型。
可选地,所述基于所述至少两个影响因素在第三预设时间长度内的历史数据对所述至少两个影响因素中每个影响因素与所述电能需量进行关联度分析,确定所述至少两个影响因素中每个影响因素对应的关联度,包括:
将所述至少两个影响因素在第三预设时间长度内的历史数据中可以进行量化处理的影响因素确定为目标因素;其中,所述目标因素的数量为至少两个;
对所述目标因素的所述历史数据进行无量纲处理;
基于灰色关联分析法计算所述目标因素的关联系数;
基于所述目标因素对应的所述历史数据的获取时间确定所述目标因素的时间权重;
基于所述时间权重和所述关联系数确定所述目标因素的关联度。
可选地,所述对所述LSTM预测模型进行超参数寻优,获得所述LSTM预测模型的超参数,包括:
基于人工蜂群算法进行M次迭代计算;
基于第M次迭代计算得到的最优解确定所述LSTM预测模型的超参数;M为正整数;
其中,第K次迭代计算包括:
引导蜂对第K蜜源进行蜜源更新操作,得到第K更新蜜源;其中,K为正整数,且K小于或等于M;
基于K和M的比值确定判断因子,其中,所述判断因子与K呈正相关;
在所述判断因子小于预设常数的情况下,基于轮盘赌的正向选择机制确定所述第K更新蜜源被跟随采集蜂选中的目标概率;在所述判断因子大于或等于所述预设常数的情况下,基于轮盘赌的反向选择机制确定所述目标概率;
所述跟随采集蜂根据所述目标概率选择任一个所述第K更新蜜源进行蜜源更新操作,得到第K+1蜜源,其中,收益最高的所述第K+1蜜源为第K次迭代计算得到的最优解。
可选地,所述在所述判断因子小于预设常数的情况下,基于轮盘赌的正向选择机制确定所述第K更新蜜源被跟随采集蜂选中的目标概率,包括:
在所述判断因子小于预设常数的情况下,第i个所述第K更新蜜源被跟随采集蜂选中的目标概率Pi满足:
所述在所述判断因子大于或等于所述预设常数的情况下,所述基于轮盘赌的反向选择机制确定所述目标概率,包括:
所述在所述判断因子大于或等于所述预设常数的情况下,所述Pi满足:
其中,Xi为第i个所述第K更新蜜源,S为所述第K更新蜜源的总数,Fit(Xi)为第i个所述第K更新蜜源的收益;Fit(Xn)为第n个所述第K更新蜜源的收益;S和i均为正整数,且i小于或等于S。
可选地,所述至少两个影响因素包括以下至少两项:规模因素、运行因素、时段因素、气象因素和其他扰动因素。
第二方面,本发明提供了一种电能需量预测装置,包括:
获取模块,用于获取电能需量对应的至少两个影响因素在第一预设时间长度内的目标数据;
生成模块,用于在所述目标数据存在缺失的情况下,利用预先训练的生成对抗网络GAN模型生成填充数据;
输入模块,用于将所述填充数据和所述目标数据输入至预先建立并训练的长短期记忆LSTM预测模型中进行电能需量预测,得到电能需量预测值;
其中,所述LSTM预测模型的输入变量为目标输入因素,所述目标输入因素为所述至少两个影响因素中与所述电能需量的关联度满足预设条件的影响因素;所述LSTM预测模型的超参数通过超参数寻优确定。
第三方面,本发明提供了一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如第一方面所述的电能需量预测方法的步骤。
第四方面,本发明提供了一种可读存储介质,所述可读存储介质上存储有程序,所述程序被处理器执行时实现如第一方面所述的电能需量预测方法的步骤。
在本发明实施例中,电能需量的预测方法基于电能需量对应的影响因素在第一预设时间长度内的目标数据,利用LSTM预测模型对电能需量进行预测。在目标数据存在缺失的情况下,可以利用预先训练的GAN模型生成填充数据。利用GAN模型的无模型重构优势,可以对缺失的数据进行补充,使得输入LSTM预测模型的数据更加完整,提高电能需量的预测结果的准确度。同时,LSTM预测模型的超参数为通过超参数寻优方法所确定的,高效地优化了LSTM预测模型的结构,进一步地提高了电能需量的预测结果的准确度。除此之外,基于影响因素与电能需量的关联度来确定LSTM预测模型的输入变量,可以降低关联度较低的影响因素对预测结果的影响。
附图说明
图1是本发明实施例提供的一种电能需量预测方法的流程示意图之一;
图2是本发明实施例提供的一种时间窗口的示意图;
图3是本发明实施例提供的一种电能需量预测方法的流程示意图之二;
图4是本发明实施例提供的一种LSTM记忆单元的结构示意图;
图5是本发明实施例提供的一种超参数寻优的流程示意图;
图6是本发明实施例提供的一种人工蜂群算法的流程示意图;
图7是本发明实施例提供的一种GAN网络的结构示意图;
图8是本发明实施例提供的一种电能需量预测装置的结构示意图;
图9是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。
如图1-图7所示,本发明实施例提供了一种电能需量预测方法。具体请参阅图1,图1是本发明实施例提供的一种电能需量预测方法的流程示意图之一,如图1所示,该电能需量预测方法可以包括以下步骤:
步骤101,获取电能需量对应的至少两个影响因素在第一预设时间长度内的目标数据。
本发明实施例提供的电能需量预测方法可以用于预测一段时间内的电能需量。具体地来说,本发明实施例提供的电能需量预测方法可以用于对用电用户在未来一定时间段内的用电量进行预测。其中,用电用户可以为任意类型的用电用户。工业企业用电量较大,因此在后续各实施例中将以用电用户为工业企业的情况为例进行说明。对于工业企业而言,可以通过本发明实施例提供的电能需量预测方法对下一个用电周期内的电能需量进行预测。
应理解的是,第一预设时间长度在此不做限定。根据实际需求的不同,第一预设时间长度的设置也可以不同。例如,在一些实施例中,第一预设时间长度可以为待预测用电周期的前至少一个用电周期。在本实施例中,第一预设时间长度与待预测时间用电周期之间的时间间隔越短,预测效果越好。同时,第一预设时间长度越长,预测效果越好。
应理解的是,目标数据包括至少两个影响因素中每一个影响因素对应的子目标数据。由于目标数据是在第一预设时间长度内的数据,因此,每一个影响因素对应的子目标数据可以包括该影响因素在第一预设时间长度内每一个时刻的数据,和/或该影响因素在第一预设时间长度内获取的多个时刻的数据的统计量,其中,该统计量可以为平均值、加权平均值、最大值、最小值、标准差等。
应理解的是,在具体实现时,电能需量是一种兼具随机性和趋势性的时间序列数据。电能需量对应的影响因素可以理解为,对电能需量的大小存在影响的因素,或者说,会影响工业企业用电量的因素。其中,至少两个影响因素的具体内容在此不做限定。可选地,在一些实施例中,前述的至少两个影响因素包括以下至少两项:规模因素、运行因素、时段因素、气象因素和其他扰动因素。其中,每一个上述影响因素还可以包括多种类型的指标。
应理解的是,规模因素可以理解为用电用户的运行规模。在本实施例中,运行规模越大,电能需量越大。工业企业整体的运行规模可以直接影响企业整体的电能需量。在一些实施例中,规模因素可以包括以下至少一项指标:电气化水平、用电负荷的增减、电气设备数量和生产岗位员工数量。
应理解的是,运行因素可以理解为电力系统内部的结构和运行状态。工业企业的电力系统内部结构复杂,不同负荷特性的组件以及电路的运行状态对于电能需量都能产生影响。在一些实施例中,运行因素可以包括以下至少一项指标:运行线路的电压、运行线路的电流、运行线路的功率因数、运行线路的频率、运行线路的电压不平衡率和其他与电能质量相关的系统设备运行参数。在具体实现时,运行因素可以为上述各指标在每一时刻的数据,也可以为上述各指标每月平均数据和/或极值数据。
应理解的是,时段因素可以理解为包括以下至少一项指标:季节、月份、是否工作日和是否为用电高峰期时段。根据时段的不同,用电量也可能会不同。例如,月份主要体现在是四季变化对冷热类设备用电负荷的影响,例如,夏季与冬季用电负荷会明显增加。是否为工作日会影响各项设备的运行状态,同时,在实际应用中,不同工作日的周期性的排产计划也会影响用电负荷。除此之外,一天当中尖峰平谷也会影响用电负荷。
应理解的是,气象因素可以理解为用电用户所处区域的气象情况。在一些实施例中,气象因素可以包括以下至少一项指标:天气类型、温度、湿度、降水量和风速。在具体实现时,根据气象因素的不同,使用的电力设备的类型、时长和频率等均不同。例如,天气类型会影响照明使用强度和使用时间,从而影响用电需量。温度与时段因素中的季节密切相关,是影响到企业实际电力需求的重要参数。湿度和风速会影响到电力设备的适用情况和维护情况。
应理解的是,其他扰动因素可以理解为外部环境的人为改变或突发事件。例如,电力设备故障和电力设备临时检修等。
进一步地,在一些实施例中,至少两个影响因素包括以下至少两项指标:电气化水平、用电负荷的增减、电气设备数量、生产岗位员工数量、电压、电流、功率因数、频率、电压不平衡率、季节、月份、当日时间段、是否节假日、天气类型、温度、湿度、降水量、风速、电力设备故障和电力设备临时检修。
应理解的是,目标数据的获取方法在此不做限定。根据影响因素的不同,目标数据的获取方法也不同。例如,在一些实施例中,规模因素可以通过工业企业的能耗管理系统查询得到。运行因素可以通过对电压电流进行分析统计获取。时段因素可以通过查看工业企业的排班情况得到。气象因素可以从第三方资料或互联网上查询得到。
应理解的是,由于影响因素的种类较多,为了方便分析处理,在得到目标数据后,可以对目标数据进行预处理。其中,预处理的具体方法在此不做限定。例如,在一些实施例中,预处理的方法包括以下至少一项:对数值型数据进行归一化处理、对分类型数据进行编码化转换和将数据划分为训练样本集和测试样本集两部分。
在本实施例中,前述的至少两个影响因素包括以下至少两项:规模因素、运行因素、时段因素、气象因素和其他扰动因素。通过获取规模因素、运行因素、时段因素、气象因素和其他扰动因素中至少两项对应的目标数据,扩大了预测电能需量时使用的样本数量,从而提高了电能需量预测值精度和准确度。
步骤102,在目标数据存在缺失的情况下,利用预先训练的生成对抗网络(Generative Adversarial Networks,GAN)模型生成填充数据。
应理解的是,目标数据存在缺失可以理解为至少一个影响因素对应的子目标数据存在缺失或存在需要剔除的异常数据。例如,对于气象因素而言,难以获得第一时间长度内每一个时刻的数据,因此可能存在数据的缺失。同时,在人工记录气象因素的情况下,可能会出现人为因素的数据错误,因此可能存在需要剔除的异常数据。
应理解的是,在一些实施例中,目标数据完整且数据符合需求,此时,可以直接将目标数据输入至预先训练的长短期记忆(Long Short-Term Memory,LSTM)预测模型进行预测。在另一些实施例中,目标数据完整但是数量较少。此时也可以利用预先训练的GAN模型生成填充数据,以扩充目标数据的数量。
应理解的是,GAN模型是预先建立并训练得到的。在目标数据存在缺失的情况下,预先训练的GAN模型可以输入随机噪声,输出相应类型的填充数据。其中,GAN模型的结构和训练过程在此不做限定。可选地,在一些实施例中,电能需量预测方法还包括以下步骤:
建立待训练GAN模型,其中,待训练GAN模型包括生成器网络和判别器网络,生成器网络和判别器网络均基于LSTM预测模型建立;
利用随机噪声以及至少两个影响因素在第二预设时间长度内的样本数据,对生成器网络和判别器网络进行迭代训练;
在生成器网络和判别器网络达到纳什平衡状态的情况下,将当次训练好的待训练GAN模型确定为GAN模型。
在具体实现时,至少两个影响因素在第二预设时间长度内的样本数据可以理解为对待训练GAN模型进行训练使用的样本。在使用样本数据对待训练GAN模型进行训练时,需要使用每一个影响因素对应的样本数据对待训练GAN模型依次进行训练,以使GAN模型可以生成不同类型的填充数据。
应理解的是,第二预设时间长度在此不做限定。根据实际需求的不同,第二预设时间长度的设置也可以不同。例如,第二预设时间长度可以为待预测用电周期的前至少一个用电周期。在具体实现时,第二预设时间长度和第一预设时间长度可以相同或不同。
应理解的是,在获得第二预设时间长度内的样本数据之后,也需要对样本数据进行预处理。其中,预处理的具体方法在此不做限定。例如,在一些实施例中,预处理包括以下至少一项:对数值型数据进行归一化处理、对分类型数据进行编码化转换和将数据划分为训练样本集和测试样本集两部分。
应理解的是,生成器网络的输入为随机噪声,输出为预设类型的填充数据。例如,在一些实施例中,运行因素中的电流数据有缺失,生成器网络输入随机噪声后可以生成电流填充数据。例如,在另一些实施例中,气象因素中的湿度数据有缺失,生成器网络输入随机噪声后可以生成湿度填充数据。
应理解的是,生成器网络基于预先训练的LSTM预测模型建立可以理解为,使用LSTM预测模型替换基础GAN模型中的生成器网络,将LSTM预测模型的隐含层进行对应替换,同时将输入变量替换为服从均匀分布的随机噪声。在具体实现时,生成器网络的输入层神经元数目为1,批次大小与LSTM预测模型相同,输出层神经节点数为影响因素的数量。
应理解的是,生成器网络的第一激活函数在此不做限定。例如,在一些实施例中,第一激活函数可以为线性整流(Rectified Linear Unit,ReLU)函数、指数线性(Exponential Linear Units,ELU)函数、缩放指数线性(Scaled Exponential LinearUnits,SELU)函数、S型(Sigmoid)函数或双曲正切(tanh)函数。
应理解的是,判别器网络的输入为实际获取到的样本数据和生成器网络输出的填充数据,输出为判断结果,即,判断器网络需要判断样本数据和填充数据为真实数据或虚假数据。因此,判别器网络的输出为二分类。
应理解的是,为了训练判别器网络识别虚假数据的能力,输入的样本数据的类型和输入的填充数据的类型应当相同。例如,生成器网络输入至判别器网络的填充数据为电压数据,输入至判别器网络的样本数据应为在第二预设时间长度内获得的电压数据。生成器网络输入至判别器网络的填充数据为电气设备数量,输入至判别器网络的样本数据应为在第二预设时间长度内获得的电气设备数量。
应理解的是,对生成器网络和判别器网络进行迭代训练可以理解为,单独地交替地对生成器网络和判别器网络进行迭代训练。生成器网络和判别器网络达到纳什平衡状态可以理解为,生成器网络和判别器网络均已完成迭代训练,此时生成器网络生成的任意填充数据的情况下,判别器网络输出结果为真实的概率为50%,输出结果为虚假的概率为50%。
使用样本数据对待训练GAN模型进行迭代训练的具体流程在此不做限定。具体地,以输入的样本数据类型为电压数据为例,使用电压数据对待训练GAN模型进行迭代训练的流程可以为:向生成器网络输入随机噪声,生成器网络生成电压填充数据并传递至判别器网络。同时,将采集得到的电压样本数据输入至判断器网络。判别器网络对电压填充数据和电压样本数据的真实性进行判断,基于判断结果与实际结果的对比得到的损失值,以反向传播的方式更新待训练GAN模型。其中,在训练过程中,生成器网络和判别器网络为交替迭代训练。
应理解的是,判别器网络基于预先训练的LSTM预测模型建立可以理解为,使用LSTM预测模型替换基础GAN模型中的判别器网络,将输入变量替换为生成器网络生成的填充数据和输入的样本数据。在具体实现时,判别器网络的输入层神经元数目、批次大小、输入层激活函数与生成器网络相同。判别器网络的输出层结果为二分类。
应理解的是,判别器网络的第二激活函数在此不做限定。例如,在一些实施例中,第二激活函数可以为ReLU函数、ELU函数、SELU函数、Sigmoid函数或tanh函数。
在本实施例中,生成器网络和判别器网络均基于LSTM预测模型建立。通过对生成器网络和判别器网络进行迭代训练,提高了生成器网络生成的填充数据与采集到的真实数据之间的相似度,从而使得GAN模型生成的填充数据更加符合数据规律,进而提高了电能需量预测值的准确度。
步骤103,将填充数据和目标数据输入至预先建立并训练的LSTM预测模型中进行电能需量预测,得到电能需量预测值。
其中,LSTM预测模型的输入变量为目标输入因素,目标输入因素为至少两个影响因素中与电能需量的关联度满足预设条件的影响因素;LSTM预测模型的超参数通过超参数寻优确定。
在具体实现时,LSTM预测模型的输入变量的选择会影响预测结果的准确度。在输入变量与电能需求的关联度较小时,得到的预测结果的准确性将会较低。在输入变量的数量过多时,LSTM预测模型的计算量过大。在本实施例中,将影响因素与电能需量的关联度作为输入变量的确定依据,提高了输入变量选择的合理性。同时,通过调整预设条件可以控制输入变量的数量,进一步地提高了LSTM预测模型的输入变量设置的合理性。
应理解的是,目标输入因素为至少两个影响因素中与电能需量的关联度满足预设条件的影响因素。其中,预设条件在此不做限定。例如,在一些实施例中,预设条件可以为关联度大于关联度阈值,其中,关联度阈值可以按照实际需求进行选取。在另一些实施例中,预设条件可以为将各个影响因素按照关联度的大小由大至小依次排列的前目标数量个影响因素。其中,目标数量的取值可以按照实际需求进行选取。
应理解的是,LSTM预测模型模型是预先建立并训练的。其中,LSTM预测模型的建立过程和训练过程在此不做限定。可选地,在一些实施例中,电能需量预测方法还包括以下步骤:
基于至少两个影响因素在第三预设时间长度内的历史数据对至少两个影响因素中每个影响因素与电能需量进行关联度分析,确定至少两个影响因素中每个影响因素对应的关联度;
将至少两个影响因素中关联度满足预设条件的影响因素确定为目标输入因素;
建立LSTM基础模型;其中,LSTM基础模型的输入变量为目标输入因素;
对LSTM基础模型进行超参数寻优,获得目标超参数;
根据目标超参数更新LSTM基础模型,得到LSTM预测模型。
应理解的是,第三预设时间长度在此不做限定。根据实际需求的不同,第三预设时间长度也可以不同。例如,第三预设时间长度可以为待预测用电周期的前至少一个用电周期。在具体实现时,第三预设时间长度和第一预设时间长度可以相同或不同。第三预设时间长度和第二预设时间长度可以相同或不同。
应理解的是,在获得第三预设时间长度内的历史数据之后,也需要对历史数据进行预处理。其中,预处理的具体方法在此不做限定。例如,在一些实施例中,预处理包括以下至少一项:对数值型数据进行归一化处理、对分类型数据进行编码化转换和将数据划分为训练样本集和测试样本集两部分。
应理解的是,LSTM基础模型的结构在此不做限定。例如,在一些实施例中,LSTM基础模型包括包含五个层次的神经网络结构,分别为输入层、隐含层、丢弃(Dropout)层、全连接层和输出层。
在具体实现时,对LSTM预测模型进行训练使用的训练样本可以为获取到的样本数据或历史数据,也可以为部分样本数据和/或部分历史数据。对LSTM预测模型进行测试使用的测试样本可以为获取到的样本数据或历史数据,也可以为部分样本数据和/或部分历史数据。在本实施例中,对LSTM预测模型进行训练使用的训练样本和对LSTM预测模型进行测试使用的测试样本不同。
在本实施例中,LSTM预测模型的输入变量根据每个影响因素对应的关联度确定。通过上述设置,为LSTM预测模型的输入变量的选择策略提供了理论依据,通过优化LSTM预测模型的输入变量提高了预测结果的准确性。LSTM预测模型的超参数通过超参数寻优确定,通过上述设置,使得LSTM预测模型的超参数更加合理。
应理解的是,影响因素与电能需量的关联度的确定方法在此不做限定。例如,可选地,在一些实施例中,基于至少两个影响因素在第三预设时间长度内的历史数据对至少两个影响因素中每个影响因素与电能需量进行关联度分析,确定至少两个影响因素中每个影响因素对应的关联度,可以包括以下步骤:
将至少两个影响因素在第三预设时间长度内的历史数据中可以进行量化处理的影响因素确定为目标因素;其中,目标因素的数量为至少两个;
对目标因素的历史数据进行无量纲处理;
基于灰色关联分析法计算目标因素的关联系数;
基于目标因素对应的历史数据的获取时间确定目标因素的时间权重;
基于时间权重和关联系数确定目标因素的关联度。
应理解的是,在一些实施例中,可以基于灰色关联分析法计算目标因素的关联系数。在另一些实施例中,也可以基于其他算法确定目标因素的关联系数。
应理解的是,基于目标因素对应的历史数据的获取时间确定目标因素的时间权重的具体方法在此不做限定。为了减弱陈旧数据对关联度的影响,通常,获取时间距离当前时间越久的数据对应的时间权重越低。
应理解的是,通过上述方案可以建立得到LSTM预测模型。在使用该LSTM预测模型进行电能需量的预测之前,可以对该LSTM预测模型进行训练和测试。其中,该LSTM预测模型进行训练和测试的具体方法在此不做限定。
在本实施例中,基于目标因素对应的历史数据的获取时间确定目标因素的时间权重;基于时间权重和关联系数确定目标因素的关联度。基于目标因素对应的历史数据的获取时间确定目标因素的时间权重可以减弱陈旧数据对关联度结果的影响,使得获得的关联度更加准确。
在具体实现时,LSTM预测模型的超参数的选择对LSTM预测模型的预测结果的准确性有较大的影响。根据经验人工设定LSTM预测模型使得LSTM预测模型的各项超参数难以同时满足需求。采用遍历搜索算法确定LSTM预测模型的超参数对计算资源的消耗较大。在本实施例中,通过超参数寻优确定LSTM预测模型的超参数可以提高得到的LSTM预测模型的超参数组合的合理性。另一方面,由于超参数寻优的计算量较小,因此对计算资源的占用也较少。
应理解的是,LSTM预测模型的超参数通过超参数寻优确定。其中,超参数寻优方法在此不做限定。例如,在一些实施例中,LSTM预测模型的超参数通过超参数寻优确定可以理解为,LSTM预测模型的超参数通过人工蜂群算法确定。在另一些实施例中,LSTM预测模型的超参数通过粒子群优化算法确定。在另一些实施例中,LSTM预测模型的超参数通过网格化寻优确定。
可选地,在一些实施例中,对LSTM预测模型进行超参数寻优,获得LSTM预测模型的超参数,可以包括以下步骤:
基于人工蜂群算法进行M次迭代计算;
基于第M次迭代计算得到的最优解确定LSTM预测模型的超参数;M为正整数;
其中,第K次迭代计算包括:
引导蜂对第K蜜源进行蜜源更新操作,得到第K更新蜜源;其中,K为正整数,且K小于或等于M;
基于K和M的比值确定判断因子,其中,判断因子与K呈正相关;
在判断因子小于预设常数的情况下,基于轮盘赌的正向选择机制确定第K更新蜜源被跟随采集蜂选中的目标概率;在判断因子大于或等于预设常数的情况下,基于轮盘赌的反向选择机制确定目标概率;
跟随采集蜂根据目标概率选择任一个第K更新蜜源进行蜜源更新操作,得到第K+1蜜源,其中,收益最高的第K+1蜜源为第K次迭代计算得到的最优解。
应理解的是,在基于人工蜂群算法进行M次迭代计算之前,可以对人工蜂群的整体结构和参数进行初始化设置。其中,对人工蜂群的整体结构和参数进行初始化设置的方法在此不做限定。在具体实现时,可以对最大迭代次数、最大滞留次数、蜂群的规模数量、蜜源数量、引导蜂数量和跟随采集蜂数量进行初始化设置。
应理解的是,蜜源位置信息可以表示为一个W维的向量。其中,W的取值等于需要确定的超参数的数量。蜜源位置信息可以理解为算法的解,因此算法的解也可以表示为一个W维的向量。
应理解的是,初始化蜜源位置信息的方式在此不做限定。例如,在一些实施例中,用于表示初始蜜源位置信息的W维向量在各维度的坐标值均在一定取值范围内随机化生成。
应理解的是,在一些实施例中,引导蜂和跟随采集蜂的数量均为多个。引导蜂和跟随采集蜂的数量可以相同。在一些实施例中,引导蜂也可以称为采蜂蜜或引领蜂,跟随采集蜂也可以称为跟随蜂或观察蜂。
应理解的是,蜜源数量可以与引导蜂数量相同,每一个引导蜂自身携带有且唯一的蜜源位置信息,即引导蜂的数量等于蜜源数量,同时等于算法的解的个数。
在对人工蜂群的整体结构和参数进行初始化设置后,可以进行M次迭代计算。其中,初始蜜源位置信息可以理解为在K为1的情况下,第一蜜源的位置信息。引导蜂首先前往其对应的第一蜜源采集蜜源。其中,采集蜜源的过程也可以理解为计算蜜源的收益的过程。
应理解的是,蜜源的收益可以用于表示蜜源的优劣程度,在一些实施例中,蜜源的收益可以通过适应度函数来计算。具体地,在一些实施例中,蜜源的收益Fit(Xi):
其中,f(Xi)为第i个第K蜜源或第i个第K更新蜜源的目标函数值,此处的目标函数为LSTM预测模型中的误差函数,其结果误差愈小则对应适应度值愈大,即算法的解的质量越好或蜜源的收益越高。
应理解的是,蜜源更新操作可以针对第K蜜源或第K更新蜜源进行。其中,蜜源更新操作可以理解为,引导蜂和/或跟随采集蜂在其对应的一个蜜源附近搜索新的蜜源,并通过对比两个蜜源之间的收益来判断是否使用新蜜源替换旧蜜源。其中,引导蜂和/或跟随采集蜂搜索新的蜜源的方式在此不做限定。在本实施例中,蜜源更新操作是迭代循环计算的,循环迭代计算出各个蜜源的收益。
应理解的是,在执行蜜源更新操作的过程中,在保留旧蜜源的情况下,需要增加将滞留次数的取值加一。在某个蜜源的当前滞留次数值等于预设的最大滞留次数值时,可以认为该处蜜源陷入了局部最优,需将其舍弃。此时携带该蜜源位置信息的引导蜂就变化为侦察蜂,其任务是搜寻新的蜜源替代之,此时无需在原蜜源的附近进行搜寻。侦察蜂搜寻新的蜜源的方式在此不做限定。在一些实施例中,侦察蜂搜寻新的蜜源的方法与初始化蜜源位置信息的方法相同。
引导蜂在执行完蜜源更新操作后,会根据第K更新蜜源的收益提供信息,吸引跟随采集蜂前去采蜜。然后可以基于K和M的比值确定判断因子,其中,判断因子与K呈正相关。其中,K为当前迭代次数,M为最大迭代次数。最大迭代次数为预先设置的,且可以根据实际需求进行修改。
应理解的是,判断因子与当前迭代次数呈正相关。其中,判断因子的具体确定方式在此不做限定。例如,在一些实施例中,判断因子为K和M的比值乘以一个预设正常数。在另一些实施例中,判断因子Q:
Q=e^(ln2·K/M)-1。
在判断因子小于预设常数的情况下,基于轮盘赌的正向选择机制确定第K更新蜜源被跟随采集蜂选中的目标概率。在判断因子大于或等于预设常数的情况下,基于轮盘赌的反向选择机制确定目标概率。
应理解的是,预设常数的取值在此不做限定。在一些实施例中,预设常数为在[0,1]范围内生成随机数。在另一些实施例中,预设常数可以为[0,1]范围内任意常数,例如,预设常数可以为0.5。
可选地,在一些实施例中,在判断因子小于预设常数的情况下,基于轮盘赌的正向选择机制确定第K更新蜜源被跟随采集蜂选中的目标概率,包括在判断因子小于预设常数的情况下,第i个第K更新蜜源被跟随采集蜂选中的目标概率Pi满足:
在判断因子大于或等于预设常数的情况下,基于轮盘赌的反向选择机制确定目标概率,包括在判断因子大于或等于预设常数的情况下,Pi满足:
其中,Xi为第i个第K更新蜜源,S为第K更新蜜源的总数,Fit(Xi)为第i个第K更新蜜源的收益;Fit(Xn)为第n个第K更新蜜源的收益;S和i均为正整数,且i小于或等于S。
在本实施例中,判断因子的大小与当前迭代次数呈正相关。通过上述设置,在迭代次数较少的情况下可以大概率地基于轮盘赌的正向选择机制确定第K更新蜜源被跟随采集蜂选中的目标概率,从而保证一定的收敛速度。而随着迭代次数增加,在迭代次数靠近最大迭代次数的情况下,可以大概率地基于轮盘赌的反向选择机制确定第K更新蜜源被跟随采集蜂选中的目标概率,从而维持蜜源的多样性,避免跟随采集蜂过度聚集。
应理解的是,每一个第K更新蜜源被选中的概率不同,因此,每一个第K更新蜜源可能会被任意只跟随采集蜂选中。在某一个第K更新蜜源被多只跟随采集蜂选中的情况下,每一只跟随采集蜂均会对该第K更新蜜源执行蜜源更新操作。
在每一次迭代计算过程中,当所有跟随采集蜂完成所有的第K更新蜜源的蜜源更新操作后,可以认为已经遍历所有第K更新蜜源的收益,可以得到多个第K+1蜜源。多个第K+1蜜源中收益最高的第K+1蜜源即为本次迭代计算过程中的最优解。在第M次迭代计算中得到的多个第M+1蜜源中收益最高的第M+1蜜源即为全局最优解。
应理解的是,在基于第M次迭代计算得到全局最优解的情况下,该第M+1蜜源的W维向量中每一个维度的元素则代表一个超参数的取值。基于第M次迭代计算得到的最优解即可确定LSTM预测模型中每一个待确定的超参数的取值。
在本实施例中,基于人工蜂群算法确定LSTM预测模型的目标超参数,同时改进了跟随采集蜂的概率选择机制。通过上述设置使得LSTM预测模型具有合适的隐含层神经元数、学习率、遗忘率等超参数。因此,LSTM预测模型可以利用长期数据记忆的优势可获得较高的预测精度,且对于不同时间间隔的用电需量影响因素的指标数据适用性良好。
在本发明实施例中,电能需量的预测方法基于电能需量对应的影响因素在第一预设时间长度内的目标数据,利用LSTM预测模型对电能需量进行预测。在目标数据存在缺失的情况下,可以利用预先训练的GAN模型生成填充数据。利用GAN模型的无模型重构优势,可以对缺失的数据进行补充,使得输入LSTM预测模型的数据更加完整,提高电能需量的预测结果的准确度。同时,LSTM预测模型的超参数为通过超参数寻优方法所确定的,高效地优化了LSTM预测模型的结构,进一步地提高了电能需量的预测结果的准确度。除此之外,基于影响因素与电能需量的关联度来确定LSTM预测模型的输入变量,可以降低关联度较低的影响因素对预测结果的影响。
在实际使用过程中,可以对历史数据、样本数据和目标数据进行预设处理。其中,对历史数据、样本数据和目标数据进行预设处理的方式可以相同或不同。下面将介绍在一个具体的实施例中,对数据进行预处理的具体方法。在实际应用中,下述的数据可以为历史数据、样本数据和目标数据中的任一者,根据实际需求可以选择相应的处理方法。
在第一种情况下,可以对数值型数据进行归一化处理。具体地,在一些实施例中,可以首先对各项影响因素的指标对应的数据进行异常值剔除,然后再进行对剩下的数据进行归一化处理。通过归一化处理,可以将所有数值型数据的取值限定在[0,1]的数值范围内,从而消除不同类型的指标之间量纲和取值范围的差异,以便于后续数据处理,同时加快LSTM预测模型的收敛速度。
归一化处理后的指标数据xp
其中,x为待归一化处理的原始数据,xmax和xmin分别为所有原始数据中的最大值与最小值。对应地,在输入LSTM预测模型的目标数据为归一化处理后的数据的情况下,在获得电能需量预测值后需要反归一化,最终实际数值的电能需量预测值xp
xp=(xmax-xmin)xr+xmin
其中,xr为LSTM预测模型获得的电能需量预测值。
在第二种情况下,可以对分类型数据进行编码化转换。典型的分类型数据包括天气因素中的天气类型,或时段因素中的月份。
下面以气象因素中的天气类型为例进行说明。可以对不同的天气类型进行编码化转换。例如,在一些实施例中,天气类型分为以下四种:晴天、多云、阴天和雨天。则可以用四位0或1特征与不同的天气类型进行对应。例如,晴天对应0001,多云对应0010,阴天对应0100,雨天对应1000。
在第三种情况下,可以对经归一化处理和/或编码化转换后的数据进行划分,分为训练样本集和测试样本集数据两部分。其中,具体的划分方法在此不做限定。
在第四种情况下,可以构建基于时间序列的输入。例如,在一些实施例中,可以首先划分时间窗口。请参见图2,如图2所示,各时间窗口的大小为D,代表实际时长中的每个月份,输入时间窗的长度可取一年,其中各时间窗口可以分别表示为D0,D1,D2,……Dn-1。由于输入时间窗的长度为一年,因此在本实施例中,n的取值为12。在Dn-1为当前时间窗口的情况下,则Dn表示待预测的下个时间窗口。上述各时间窗口构成一个时间序列,对于单独的每个时间窗口,即对应某月的数据。
在另一些实施例中,输入时间窗的长度为两年,则输入为当前时间前24个月所选指标对应的数据,将其表示为Xj×k×l的三阶矩阵形式。在本实施例中,j为样本的数目,k为输入层时间步数,l为输入层维数。由上述时间窗口的结构,可以确定输入层维数为指标数目,输出层维数为1,即电能需量。
请参见图3,图3为本发明实施例提供的一种电能需量预测方法的流程示意图之二。下面将以一个具体的实施例为例,对电能需量预测的具体流程进行说明。
首先,需要说明的是,在本实施例中,至少两个影响因素包括规模因素、运行因素、气象因素和其他扰动因素。第一预设时间长度、第二预设时间长度和第三预设时间长度均为两个历史用电周期。上述各影响因素包括的指标对应的数据均已进行预处理。
首先,计算影响因素与电能需量之间的关联度,确定目标因素。
具体地,首先获取两个历史用电周期每一个指标对应的历史数据。将可以进行量化处理的指标确定为目标因素,在本实施例中,目标因素为电气设备数量、生产岗位员工数量、电压、电流、功率因数、频率、电压不平衡率、温度、湿度、降水量和风速。
然后根据目标因素的历史数据建立原始指标序列C:
在本实施例中,a为规模因素、运行因素和气象因素的编号;b为规模因素、运行因素和气象因素下的具体指标的编号。例如,a为1用于表示规模因素,则C11用于表示电气设备数量,C12用于表示生产岗位员工数量。例如,a为3用于表示气象因素,则C31用于表示温度、C32用于表示湿度、C33用于表示降水量、C34用于表示风速。
由于各个目标因素的类型不同,因此需要对目标因素的历史数据进行无量纲处理。具体地,以C1b为基准,以其他目标因素与C1b的比值替换目标因素的历史数据的原始值,然后再对矩阵进行优化处理得到差值序列Δ:
在本实施例中,最大差值MaxΔ和最小差值MinΔ分别可以表示为:
MaxΔ=maxa{maxbab}};
MinΔ=mina{min{Δab}}。
基于灰色关联分析法可以得到关联系数δab
在本实施例中,σab可以通过下式计算得到:
在本实施例中,ρ的取值范围为(0,1),ρ为(0,1)之间的任意常数。然后,可以基于目标因素对应的历史数据的获取时间确定目标因素的时间权重。在本实施例中,为了减弱陈旧数据的影响力,目标因素的时间权重与历史数据获取时间与当前时间之差呈负相关。
基于时间权重得到优先级判断矩阵Tpq
由上述优先级判断矩阵Tpq可以得到权重系数ω(t):
将上述的权重系数ω(t)与上述的关联系数δab可以得到关联度Tδj
根据关联度Tδj可以得到每一个目标因素与电能需量之间的关联度。
然后,建立LSTM基础模型。在本实施例中,选择目标因素中关联度大于预设值的目标因素为LSTM预测模型的输入变量。通过调整预设值的大小,可以控制输入变量的数量。
具体地,LSTM基础模型包括包含五个层次的神经网络结构,分别为输入层、隐含层、Dropout层、全连接层和输出层。其中,LSTM基础模型使用LSTM记忆单元对输入数据进行计算,提取和记忆输入数据的时序特性,其中,LSTM记忆单元也可以简称为单元。Dropout层可以防止训练模型过拟合,从而提升模型的泛化能力。Dropout层的输出通过全连接层到达输出层。而输出层则采用激活函数限制结果区间,并输出最终的预测结果。
如图4所示,LSTM记忆单元包括三个门结构,即输入门it、遗忘门ft和输出门ot,用以控制LSTM记忆单元的状态。
在本实施例中,输入门it是一个元素介于[0,1]区间内的向量,由Xt和ht-1经由sigmoid激活函数计算得到,ht-1与Xt分别为t-1时刻隐含层的输出值和t时刻网络的输入值。
遗忘门ft表示Ct-1的哪些特征被用于计算Ct,即在当前时刻,遗忘门负责控制上一时刻的细胞单元状态到此时状态的筛选情况。其中,Ct为t时刻的单元状态。Ct-1为t-1时刻的单元状态。遗忘门ft是一个元素介于[0,1]区间内的向量,由xt和ht-1经由sigmoid激活函数计算得到。
遗忘门ft用于确定信息的遗忘程度,其内部计算公式为:
ft=σ(wf·[ht-1,Xt]+bf)。
在本实施例中,σ(x)为sigmoid函数wf为遗忘门的权重矩阵,wf与[ht-1,Xt]之间采用点积运算,bf则为遗忘门的偏置项。
同理,输入门it和输出门ot的内部计算公式分别为:
it=σ(wi·[ht-1,Xt]+bi);
ot=σ(wo·[ht-1,Xt]+bo)。
在本实施例中,wi为输入门的权重矩阵,wo为输出门的权重矩阵,bi则为输入门的偏置项,bo则为输出门的偏置项。在当前t时刻,输入单元状态由当前网络的输入Xt和t-1时刻LSTM隐含层输出值ht-1决定。
输入单元状态
在本实施例中,tanh(x)为双曲正切函数wc为输入单元状态的权重矩阵,bc为输入单元状态的偏置项。
当前t时刻的单元状态ct由遗忘门ft、输入门it、t-1时刻的单元状态ct-1以及当前的输入单元状态所决定,t时刻的单元状态ct
当前t时刻LSTM的隐含层输出值由输出门ot和当前单元状态ct决定,t时刻LSTM的隐含层输出值ht
ht=ot·tanh(ct);
Dropout层在训练过程中随机地遗忘某些神经元,促使大量的神经元加入到数据特征提取中,降低对神经元特殊权值的敏感度。Dropout层的遗忘率表示为fd
全连接层的输出Dy
Dy=σ(wy·ht+by);
在本实施例中,wy为输出层的权重矩阵,by为输出层的偏置项。
输出层的激活函数采用线性整流函数,具体表示为:
输出层的输入即为全连接层的输出Dy,通过上述线性整流激活函数可将输出限制在正数范围。
本实施例中中采用平均绝对误差作为误差函数,以反映预测值误差的实际情况,表达式为:
在上述的表达式中,N为样本数目,fi为观察值,yi为预测值。
应理解的是,LSTM基础模型中的超参数包括隐含层数H、隐含层神经节点数Hn、时间窗步长L、Dropout层遗忘率fd、最大训练次数Tmax和初始学习率Q。其中,在本实施例中,可以根据经验设置H=1,Tmax=1000。
然后,可以通过超参数寻优确定除H和Tmax之外的其他超参数。在本实施例中,可以通过人工蜂群算法对LSTM基础模型进行超参数寻优。请参见图5,图5为本发明实施例提供的一种超参数寻优的流程示意图。
具体地,首先对人工蜂群算法的整体结构和参数进行初始化设置。请参见图6,图6为本发明实施例提供的一种人工蜂群算法的流程示意图。初始化设定最大迭代次数M和最大滞留次数Lm,此外需要进行初始化设置的参数包括:蜂群的规模数量Nt,蜜源数量NS,引导蜂数量Nl,跟随采集蜂数量Nf。其中,在一些实施例中,蜜源也可以称为蜜源点或蜜源位置。
其中,初始化的Nl和Nf相等,各占Nt的二分之一。NS始终保持不变,每一只引导蜂自身携带有且唯一的蜜源位置信息,即引导蜂的数量等于算法解的个数。
然后,基于人工蜂群算法进行M次迭代计算。下面将以第K次迭代计算的过程为例进行说明。
首先确定初始蜜源点。其中,初始蜜源点通过一个W维的向量表示,W的取值为LSTM基础模型需要确定的超参数的数量。在本实施例中,W的取值为4。其中的第i(1≤i≤NS)个解向量为Xi=[Xi1,Xi2,…XiK]T,该向量在各维度的坐标值均在一定取值范围内随机化生成,第i个初始蜜源点的确定方法采用下式:
Xik=Xik,min+r×(Xik,max-Xik,min);
其中,Xik,max和Xik,min分别为各维度数值大小的上下边界,r取(0,1)内的随机数值。
在本实施例中,蜜源的优劣程度取决于其收益,通过转化成适应度函数来评判蜜源的收益。因此,第i个蜜源点的收益Fit(Xi):
在本实施例中,f(Xi)为第i个第K蜜源的目标函数值或第i个第K更新蜜源的目标函数值,此处的目标函数为LSTM基础模型中的误差函数,其结果误差愈小则对应适应度值愈大,解的质量愈优。循环迭代计算出各个蜜源的收益。
引导蜂在各自对应的第K蜜源附近搜索新的蜜源点,以对第K蜜源进行蜜源更新操作,得到第K更新蜜源;其中,K为正整数,且K小于或等于M。其中,引导蜂的搜索公式为:
Xi *=Xi+r1×(Xi-Xk)+r2×(Yik-Xik);
其中,Xi *为新的解,k∈{1,2,…,K,k≠i},r1为(0,1)范围内的随机扰动项,r2为(0,1.5)范围内的随机扰动项,Yik为全局最优解的第k维变量。
在新蜜源点的收益高过旧蜜源点的收益时,将新蜜源点确定为第K更新蜜源。在新蜜源点的收益低于或等于旧蜜源点的收益时,将旧蜜源点确定为第K更新蜜源并记录一次替换失败数,即滞留次数L数值加一。
在所有引导蜂均完成蜜源更新操作后,跟随采集蜂按照目标概率挑选引导蜂提供的第K更新蜜源的信息并前往该第K更新蜜源采蜜。收益高的第K更新蜜源有更高的概率被选中。
基于当前迭代次数和最大迭代次数的比值确定判断因子,其中,判断因子Q:
Q=e^(ln2·K/M)-1。
在[0,1]范围内随机生成预设常数γ,并将预设常数γ与Q作大小比较。在判断因子小于预设常数的情况下,第i个第K更新蜜源被跟随采集蜂选中的目标概率Pi满足:
在判断因子大于或等于预设常数的情况下,Pi满足:
其中,Xi为第i个第K更新蜜源,S为第K更新蜜源的总数,Fit(Xi)为第i个第K更新蜜源的收益;Fit(Xn)为第n个第K更新蜜源的收益;S和i均为正整数,且i小于或等于S。
跟随采集蜂根据目标概率选择任一个第K更新蜜源后,同样会对该第K更新蜜源进行蜜源更新操作。具体地,跟随采集蜂在各自选择的第K更新蜜源位置附近搜索新的蜜源点,以对第K更新蜜源进行蜜源更新操作,得到第K+1蜜源。其中,跟随采集蜂的搜索公式与引导蜂的搜索公式相同。
当某个蜜源的当前滞留次数值达到了预设的最大滞留次数值Lm,认为该处蜜源点陷入了局部最优,需将其舍弃。此时携带该蜜源信息的引导蜂就变化为侦察蜂,其任务是搜寻新的蜜源替代之,即按照第i个初始蜜源点的确定方法生成新的蜜源点。
在第K次迭代计算的过程中,收益最高的第K+1蜜源为本轮迭代计算得到的最优解。在K小于M的情况下,进行第K+1次迭代计算,在K等于M的情况下,基于本轮迭代计算得到的最优解确定目标超参数。具体地,由于最优解为W维的向量,因此该向量中每一个元素均对应一个目标超参数的取值。
使用目标超参数替换LSTM基础模型的超参数,即可得到LSTM预测模型。
使用LSTM预测模型建立待训练GAN模型并训练待训练GAN模型。请参见图7,待训练GAN模型的结构示意图如图7所示。在本实施例中,需要生成填充数据的影响因素为气象因素
具体地,基于LSTM预测模型建立生成器网络G(z),把隐含层进行对应替换,将输入变量替换为服从均匀分布的随机噪声z,随机噪声z的范围选择(0,1),输入层为1个神经节点,批次大小与LSTM预测模型一致。输出层神经节点数为气象因素对应的指标的数量。
在本实施例中,生成器网络的激活函数采用Relu,以减少梯度爆炸的情况,即:
r=max(0,x)
生成器网络目标为使得判别器获得最小差异结果,所以损失函数可以表示为:
在本实施例中,时间步长选取为10,生成网络训练次数控制为1000次。
基于LSTM预测模型建立判别器网络D(x),判别器网络的输入变量为气象因素各指标的历史数据和生成器产生的填充数据,输入层神经元数目、批次大小、输入层激励函数与生成器网络相同。由于判别器网络的输出层结果为二分类,所以输出层激励函数采用Sigmoid函数:
判别器网络目标为获得最大差异结果,所以损失函数可以表示为:
在本实施例中,判别器网络的时间步长和训练次数同生成器网络。
对生成网络器和判别器网络进行权重和偏置的初始化,将获得的气象因素的指标的历史数据作为判别器网络的输入,通过梯度下降法更新其网络权重和偏置,进行待训练GAN模型的优化提升。通过生成器和判别器的交替优化训练,直至两个网络间达到纳什平衡状态,此时认为待训练GAN模型已训练完成。
最后,在需要对电能需量进行预测时,获取电能需量对应的至少两个影响因素在第一预设时间长度内的目标数据。在目标数据存在缺失的情况下,利用预先训练的生成对抗网络GAN模型生成填充数据。将填充数据和目标数据输入至LSTM预测模型中进行电能需量预测,得到电能需量预测值。
如图8所示,本发明实施例还提供了一种电能需量预测装置800,电能需量预测装置800包括:
获取模块801,用于获取电能需量对应的至少两个影响因素在第一预设时间长度内的目标数据;
生成模块802,用于在目标数据存在缺失的情况下,利用预先训练的生成对抗网络GAN模型生成填充数据;
输入模块803,用于将填充数据和目标数据输入至预先建立并训练的长短期记忆LSTM预测模型中进行电能需量预测,得到电能需量预测值;
其中,LSTM预测模型的输入变量为目标输入因素,目标输入因素为至少两个影响因素中与电能需量的关联度满足预设条件的影响因素;LSTM预测模型的超参数通过超参数寻优确定。
可选地,电能需量预测装置800还包括:
第一建立模块,用于建立待训练GAN模型,其中,待训练GAN模型包括生成器网络和判别器网络,生成器网络和判别器网络均基于LSTM预测模型建立;
迭代训练模块,用于利用随机噪声以及至少两个影响因素在第二预设时间长度内的样本数据,对生成器网络和判别器网络进行迭代训练;
第一确定模块,用于在生成器网络和判别器网络达到纳什平衡状态的情况下,将当次训练好的待训练GAN模型确定为GAN模型。
可选地,电能需量预测装置800还包括:
第二确定模块,用于基于至少两个影响因素在第三预设时间长度内的历史数据对至少两个影响因素中每个影响因素与电能需量进行关联度分析,确定至少两个影响因素中每个影响因素对应的关联度;
第三确定模块,用于将至少两个影响因素中关联度满足预设条件的影响因素确定为目标输入因素;
第二建立模块,用于建立LSTM基础模型;其中,LSTM基础模型的输入变量为目标输入因素;
超参数寻优模块,用于对LSTM基础模型进行超参数寻优,获得目标超参数;
更新模块,用于根据目标超参数更新LSTM基础模型,得到LSTM预测模型。
可选地,第二确定模块包括:
第一确定单元,用于将至少两个影响因素在第三预设时间长度内的历史数据中可以进行量化处理的影响因素确定为目标因素;其中,目标因素的数量为至少两个;
处理单元,用于对目标因素的历史数据进行无量纲处理;
计算单元,用于基于灰色关联分析法计算目标因素的关联系数;
第二确定单元,用于基于目标因素对应的历史数据的获取时间确定目标因素的时间权重;
第三确定单元,用于基于时间权重和关联系数确定目标因素的关联度。
可选地,超参数寻优模块包括:
迭代计算单元,用于基于人工蜂群算法进行M次迭代计算;
第四确定单元,用于基于第M次迭代计算得到的最优解确定LSTM预测模型的超参数;M为正整数;
其中,第K次迭代计算包括:
引导蜂对第K蜜源进行蜜源更新操作,得到第K更新蜜源;其中,K为正整数,且K小于或等于M;
基于K和M的比值确定判断因子,其中,判断因子与K呈正相关;
在判断因子小于预设常数的情况下,基于轮盘赌的正向选择机制确定第K更新蜜源被跟随采集蜂选中的目标概率;在判断因子大于或等于预设常数的情况下,基于轮盘赌的反向选择机制确定目标概率;
跟随采集蜂根据目标概率选择任一个第K更新蜜源进行蜜源更新操作,得到第K+1蜜源,其中,收益最高的第K+1蜜源为第K次迭代计算得到的最优解。
可选地,在判断因子小于预设常数的情况下,基于轮盘赌的正向选择机制确定第K更新蜜源被跟随采集蜂选中的目标概率,包括:
在判断因子小于预设常数的情况下,第i个第K更新蜜源被跟随采集蜂选中的目标概率Pi满足:
在判断因子大于或等于预设常数的情况下,基于轮盘赌的反向选择机制确定目标概率,包括:
在判断因子大于或等于预设常数的情况下,Pi满足:
其中,Xi为第i个第K更新蜜源,S为第K更新蜜源的总数,Fit(Xi)为第i个第K更新蜜源的收益;Fit(Xn)为第n个第K更新蜜源的收益;S和i均为正整数,且i小于或等于S。
可选地,至少两个影响因素包括以下至少两项:规模因素、运行因素、时段因素、气象因素和其他扰动因素。
本发明实施例提供的电能需量预测装置800能够实现图1所示的方法实施例实现的各个过程,且能够取得相同的有益效果,为避免重复,这里不再赘述。
可选地,如图9所示,本发明实施例还提供一种电子设备900,包括处理器901,存储器902,存储在存储器902上并可在处理器901上运行的程序或指令,该程序或指令被处理器901执行时实现如图1所示方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要注意的是,本发明实施例中的电子设备包括上述的移动电子设备和非移动电子设备。
本发明实施例还提供一种可读存储介质,可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现如图1所示方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,处理器为上述实施例中的电子设备中的处理器。可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本发明实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (10)

1.一种电能需量预测方法,其特征在于,包括:
获取电能需量对应的至少两个影响因素在第一预设时间长度内的目标数据;
在所述目标数据存在缺失的情况下,利用预先训练的生成对抗网络GAN模型生成填充数据;
将所述填充数据和所述目标数据输入至预先建立并训练的长短期记忆LSTM预测模型中进行电能需量预测,得到电能需量预测值;
其中,所述LSTM预测模型的输入变量为目标输入因素,所述目标输入因素为所述至少两个影响因素中与所述电能需量的关联度满足预设条件的影响因素;所述LSTM预测模型的超参数通过超参数寻优确定。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
建立待训练GAN模型,其中,所述待训练GAN模型包括生成器网络和判别器网络,所述生成器网络和所述判别器网络均基于所述LSTM预测模型建立;
利用随机噪声以及所述至少两个影响因素在第二预设时间长度内的样本数据,对所述生成器网络和所述判别器网络进行迭代训练;
在所述生成器网络和所述判别器网络达到纳什平衡状态的情况下,将当次训练好的所述待训练GAN模型确定为所述GAN模型。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于所述至少两个影响因素在第三预设时间长度内的历史数据对所述至少两个影响因素中每个影响因素与所述电能需量进行关联度分析,确定所述至少两个影响因素中每个影响因素对应的关联度;
将所述至少两个影响因素中所述关联度满足所述预设条件的影响因素确定为目标输入因素;
建立LSTM基础模型;其中,所述LSTM基础模型的输入变量为所述目标输入因素;
对所述LSTM基础模型进行超参数寻优,获得目标超参数;
根据所述目标超参数更新所述LSTM基础模型,得到LSTM预测模型。
4.根据权利要求3所述的方法,其特征在于,所述基于所述至少两个影响因素在第三预设时间长度内的历史数据对所述至少两个影响因素中每个影响因素与所述电能需量进行关联度分析,确定所述至少两个影响因素中每个影响因素对应的关联度,包括:
将所述至少两个影响因素在第三预设时间长度内的历史数据中可以进行量化处理的影响因素确定为目标因素;其中,所述目标因素的数量为至少两个;
对所述目标因素的所述历史数据进行无量纲处理;
基于灰色关联分析法计算所述目标因素的关联系数;
基于所述目标因素对应的所述历史数据的获取时间确定所述目标因素的时间权重;
基于所述时间权重和所述关联系数确定所述目标因素的关联度。
5.根据权利要求3所述的方法,其特征在于,所述对所述LSTM预测模型进行超参数寻优,获得所述LSTM预测模型的超参数,包括:
基于人工蜂群算法进行M次迭代计算;
基于第M次迭代计算得到的最优解确定所述LSTM预测模型的超参数;M为正整数;
其中,第K次迭代计算包括:
引导蜂对第K蜜源进行蜜源更新操作,得到第K更新蜜源;其中,K为正整数,且K小于或等于M;
基于K和M的比值确定判断因子,其中,所述判断因子与K呈正相关;
在所述判断因子小于预设常数的情况下,基于轮盘赌的正向选择机制确定所述第K更新蜜源被跟随采集蜂选中的目标概率;在所述判断因子大于或等于所述预设常数的情况下,基于轮盘赌的反向选择机制确定所述目标概率;
所述跟随采集蜂根据所述目标概率选择任一个所述第K更新蜜源进行蜜源更新操作,得到第K+1蜜源,其中,收益最高的所述第K+1蜜源为第K次迭代计算得到的最优解。
6.根据权利要求5所述的方法,其特征在于,所述在所述判断因子小于预设常数的情况下,基于轮盘赌的正向选择机制确定所述第K更新蜜源被跟随采集蜂选中的目标概率,包括:
在所述判断因子小于预设常数的情况下,第i个所述第K更新蜜源被跟随采集蜂选中的目标概率Pi满足:
所述在所述判断因子大于或等于所述预设常数的情况下,所述基于轮盘赌的反向选择机制确定所述目标概率,包括:
所述在所述判断因子大于或等于所述预设常数的情况下,所述Pi满足:
其中,Xi为第i个所述第K更新蜜源,S为所述第K更新蜜源的总数,Fit(Xi)为第i个所述第K更新蜜源的收益;Fit(Xn)为第n个所述第K更新蜜源的收益;S和i均为正整数,且i小于或等于S。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述至少两个影响因素包括以下至少两项:规模因素、运行因素、时段因素、气象因素和其他扰动因素。
8.一种电能需量预测装置,其特征在于,包括:
获取模块,用于获取电能需量对应的至少两个影响因素在第一预设时间长度内的目标数据;
生成模块,用于在所述目标数据存在缺失的情况下,利用预先训练的生成对抗网络GAN模型生成填充数据;
输入模块,用于将所述填充数据和所述目标数据输入至预先建立并训练的长短期记忆LSTM预测模型中进行电能需量预测,得到电能需量预测值;
其中,所述LSTM预测模型的输入变量为目标输入因素,所述目标输入因素为所述至少两个影响因素中与所述电能需量的关联度满足预设条件的影响因素;所述LSTM预测模型的超参数通过超参数寻优确定。
9.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如权利要求1至7中任一项所述的电能需量预测方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有程序,所述程序被处理器执行时实现如权利要求1至7中任一项所述的电能需量预测方法的步骤。
CN202210155723.3A 2022-02-21 2022-02-21 电能需量预测方法和相关设备 Pending CN116681147A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210155723.3A CN116681147A (zh) 2022-02-21 2022-02-21 电能需量预测方法和相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210155723.3A CN116681147A (zh) 2022-02-21 2022-02-21 电能需量预测方法和相关设备

Publications (1)

Publication Number Publication Date
CN116681147A true CN116681147A (zh) 2023-09-01

Family

ID=87779609

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210155723.3A Pending CN116681147A (zh) 2022-02-21 2022-02-21 电能需量预测方法和相关设备

Country Status (1)

Country Link
CN (1) CN116681147A (zh)

Similar Documents

Publication Publication Date Title
CN110705743B (zh) 一种基于长短期记忆神经网络的新能源消纳电量预测方法
Ke et al. Short-term electrical load forecasting method based on stacked auto-encoding and GRU neural network
CN113554466B (zh) 一种短期用电量预测模型构建方法、预测方法和装置
CN111260136A (zh) 一种基于arima-lstm组合模型的楼宇短期负荷预测方法
CN112990556A (zh) 一种基于Prophet-LSTM模型的用户用电能耗预测方法
Wang et al. LSTM-based short-term load forecasting for building electricity consumption
CN108388962B (zh) 一种风电功率预测系统及方法
CN112329990A (zh) 一种基于lstm-bp神经网络的用户用电负荷预测方法
CN115688579A (zh) 一种基于生成对抗网络的流域多点水位预测预警方法
CN111861013A (zh) 一种电力负荷预测方法及装置
CN112001537B (zh) 一种基于灰色模型和支持向量机的短期风电功率预测方法
CN114492922A (zh) 一种中长期发电量预测方法
CN115271186B (zh) 一种基于延时因子和PSO RNN Attention模型的水库水位预测预警方法
CN113011680A (zh) 一种电力负荷预测方法及系统
CN114021848A (zh) 一种基于lstm深度学习的发电量需求预测方法
CN112990587A (zh) 一种对台区用电进行精准预测的方法及系统、设备、介质
CN115358461A (zh) 天然气负荷预测方法、装置、设备、介质
CN114357670A (zh) 一种基于bls和自编码器的配电网用电数据异常预警方法
CN115358437A (zh) 基于卷积神经网络的供电负荷预测方法
CN116014722A (zh) 基于季节分解和卷积网络的次日光伏发电预测方法及系统
CN114897204A (zh) 一种海上风电场短期风速预测方法和装置
CN114330934A (zh) 一种模型参数自适应的gru新能源短期发电功率预测方法
CN116826737A (zh) 一种光伏功率的预测方法、装置、存储介质及设备
CN115481788A (zh) 相变储能系统负荷预测方法及系统
CN113762591B (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination