CN116384574A - 一种基于w-lstm的非参数负荷区间预测方法 - Google Patents
一种基于w-lstm的非参数负荷区间预测方法 Download PDFInfo
- Publication number
- CN116384574A CN116384574A CN202310348675.4A CN202310348675A CN116384574A CN 116384574 A CN116384574 A CN 116384574A CN 202310348675 A CN202310348675 A CN 202310348675A CN 116384574 A CN116384574 A CN 116384574A
- Authority
- CN
- China
- Prior art keywords
- data
- power load
- prediction
- interval
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000013528 artificial neural network Methods 0.000 claims abstract description 27
- 230000006870 function Effects 0.000 claims abstract description 26
- 239000013598 vector Substances 0.000 claims abstract description 22
- 230000009466 transformation Effects 0.000 claims abstract description 18
- 230000002159 abnormal effect Effects 0.000 claims abstract description 11
- 230000008859 change Effects 0.000 claims abstract description 7
- 238000000605 extraction Methods 0.000 claims abstract description 4
- 238000006243 chemical reaction Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 15
- 238000012360 testing method Methods 0.000 claims description 12
- 238000003062 neural network model Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 230000015654 memory Effects 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 7
- 108090000672 Annexin A5 Proteins 0.000 claims description 5
- 125000004122 cyclic group Chemical group 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000005065 mining Methods 0.000 abstract 1
- 238000013459 approach Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2131—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on a transform domain processing, e.g. wavelet transform
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/003—Load forecast, e.g. methods or systems for forecasting future load demand
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Tourism & Hospitality (AREA)
- Molecular Biology (AREA)
- Marketing (AREA)
- Mathematical Physics (AREA)
- General Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Power Engineering (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明公开了一种基于W‑LSTM的非参数负荷区间预测方法,步骤包括:S1,对收集的电力负荷数据集进行缺失值填补、异常值剔除;S2,将完成预处理的电力负荷时间序列数据集转换为监督学习数据集,并使用离散小波变换进行特征提取;S3,将提取特征向量输入以LQD为损失函数的LSTM神经网络,实现电力负荷区间预测。本发明使用W‑LSTM神经网络进行电力负荷区间预测时,使用离散小波变化挖掘了电力负荷时序特性,提高了LSTM神经网络的预测精度,同时利用LQD损失函数,便捷准确的实现了非参数负荷区间预测。
Description
技术领域
本发明涉及电力负荷区间预测技术领域,具体涉及一种基于W-LSTM的非参数负荷区间预测方法。
背景技术
随着电动汽车的大量接入以及需求响应技术的迅速发展,现代的电力负荷相比于传统的电力负荷波动性更强,随机性更大,因此区间预测开始被广泛应用到电力负荷预测领域,使用置信区间的形式来量化预测不确定性。区间预测可以分为参数法与非参数法,其中参数发需要提前假定负荷服从某种类型的概率分布,如果概率分布对电力负荷大小分布的描述不够准确则可能导致区间预测精度不足;而非参数法不需要假定电力负荷服从某种类型的概率分布,能够较好的适应目前变化趋势复杂的电力负荷。因此本申请基于长短期记忆网络(long short-term memory,LSTM),使用LQD损失函数,便捷准确的实现了电力负荷非参数区间预测,同时使用多级离散小波变换挖掘原始电力负荷时间序列特征,提升了区间预测的精度。
中国专利CN202010418956.9公开了基于QRA-LSTM的日前光伏功率非参数概率预测方法,采用光伏历史数据和数值天气预报数据(NSW)训练了一组相互独立的长短期记忆网络(LSTM)确定性预测模型,并通过分位数回归平均算法(QRA)集成各独立LSTM预测模型生成了光伏出力的非参数概率预测模型,然,该方法没有考虑LSTM神经网络在不同频域挖掘负荷的时序特征,在同时存在高频分量和低频分量场合的预测存在缺陷。
发明内容
本发明的目的在于解决现有区间预测方法对电力负荷区间预测精确度不足的问题,提供了一种基于W-LSTM的非参数负荷区间预测方法。本发明首先将收集得到的电力负荷时间序列数据集进行缺失值填补、异常值剔除等预处理;完成预处理后,将电力负荷时间序列数据转换为监督学习数据集,并使用多级离散小波变换提取得到原始电力负荷的特征向量;最后以提取得到的特征向量作为LSTM神经网络的输入,并以LQD损失函数训练LSTM神经网络,实现了精度更高的电力负荷非参数区间预测方法。
本发明的目的是通过以下技术方案来实现:一种基于W-LSTM的非参数负荷区间预测方法,包括步骤:
步骤一,对收集的电力负荷时间序列数据集进行缺失值填补、异常值剔除的预处理;
步骤二,将完成预处理的电力负荷时间序列数据集转换为监督学习数据集;
步骤三,使用离散小波变换提取电力负荷时间序列的特征向量;
步骤四,将离散小波变换提取得到的特征向量输入以LQD损失函数训练的LSTM神经网络,得到电力负荷非参数区间预测结果。
进一步地,所述步骤一中时间序列数据集进行缺失值填补的方法为:
判断缺失数据类型,如果是单点数据缺失,则使用缺失数据前一个时间点和缺失数据后一个时间点的数据平均值填补缺失数据;
如果连续多个时间点的数据值均为缺失,即某个时间段的数据值缺失,则使用整个时间序列数据集中相同时间段的数据值的平均值填补缺失时间段的数据值。
进一步地,所述步骤一中电力负荷时间序列缺失值填补和异常值剔除方法为:
对于缺失数据,使用缺失数据前后时间点的数据平均值填补缺失数据:
对于异常数据,使用数据变化率来剔除异常值:
式中,rt时间点t电力负荷的变换率,pt、pt-1分别代表时间点t和时间点t-1的电力负荷数据值。
如果某个时间点的电力负荷变化率大于0.8则认为该时间点的电力负荷数据值为异常值。对于异常数据点,使用异常数据点前后时间点的数据平均值替代异常数据。
进一步地,所述步骤二中完成预处理的电力负荷时间序列数据集转换为监督学习数据集的方法为:
得到完成预处理的电力负荷时间序列后,以过去12个时间点的电力负荷大小为预测模型的输入xi={pt-12,pt-11,pt-10,…,pt-1},以当前时间点的电力负荷大小为标签yi={pt},得到(xi,yi)这样成对的监督学习数据集。
进一步地,所述步骤三中使用离散小波变换提取电力负荷时间序列的特征向量方法为:
得到模型输入xi={pt-12,pt-11,pt-10,…,pt-1}后,使用多级离散小波变换从电力负荷时间序列数据中提取特征向量,将提取得到的第m级低频分量和第m级高频分量分别记为xl(m)和xh(m)。其中第m+1级变换是将第m级变换得到的低频分量分别送入一个低通滤波器l={l1,...,lk,...,lK}和一个高通滤波器h={h1,...,hk,...,hK}:
经过i次变换后,可以提取得到一个特征向量序列:
Fi={xh(1),xh(2),...,xh(m),xl(m)} (5)
进一步地,所述步骤四中LQD损失函数为:
式中,Pr()代表满足括号中条件的概率。对于n组输入与标签对应的样本,用ki代表第i个样本的标签值是否落入给出的预测区间中:
定义c为n组样本中,标签值落入给出预测区间内的数量:
则预测区间的覆盖率可以表示为:
包含标签值的预测区间的平均宽度可以表示为:
一个好的预测区间,一方面应该尽可能保证区间覆盖率PICP接近理论置信度(1-α),同时也应该尽可能保证预测区间平均宽度MPIW越小,因此将损失函数LQD定义为:
式中,MPIW代表含标签值的预测区间平均宽度,应该越小越好,λ代表权重系数,本申请取1,n代表样本数量,(1-α)代表理论置信度,PICP代表预测区间覆盖率。
进一步地,所述步骤四中以LQD损失函数训练的LSTM神经网络,得到电力负荷非参数区间预测结果方法为:
将电力负荷时间序列数据集转换得到的监督学习数据集按照8:2划分为训练集和测试集,其中训练集用来训练LSTM神经网络模型,测试集用来测试LSTM神经网络模型区间预测性能;
LSTM神经网络是在循环神经网络的基础上改进得到,一定程度上解决了循环神经网络梯度爆照和梯度消失的问题,其表达式为:
Ct=ftCt-1+it tanh(WC·[ht-1,xt]+bC) (12)
it=σ(Wi·[ht-1,xt]+bi) (13)
it=σ(Wi·[ht-1,xt]+bi) (14)
ft=σ(Wf·[ht-1,xt]+bf) (15)
ot=σ(Wo[ht-1,xt]+bo) (16)
式中,xt代表多级离散小波变换提取的特征向量,it是输入门,ft是遗忘门,ht-1是上一个时间点的输出,Ct-1是上一个时间点的记忆,ht是当前时间点的输出,Ct是当前时间点的记忆。W代表权重矩阵参数,b是偏置项,σ和tanh分别是sigmoid和tanh激活函数。
本发明的有益效果是:利用多级离散小波变换W-LSTM神经网络模型进行电力负荷非参数区间预测时,在LSTM神经网络的基础上采用多级离散小波变化将原始负荷时间序列分解为了多个高频分量和一个低频分量,帮助LSTM神经网络在不同频域挖掘负荷的时序特征,提高预测性能;同时使用LQD损失函数便捷有效的帮助LSTM神经网络模型实现了电力负荷非参数区间预测;预测区间的覆盖率越接近理论置信度越好,平均宽度越小越好,因此本发明设计一个损失函数,是平均宽度+系数*(理论置信度-实际区间覆盖率)^2。训练是让损失函数变小,这一过程中,平均宽度变小,理论置信度和实际区间覆盖率越来越接近。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍。显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一种基于W-LSTM的非参数负荷区间预测方法的实现流程图。
图2是本发明一种基于W-LSTM的非参数负荷区间预测方法针对连续一周负荷,给出的90%置信度预测区间图。
具体实施方式
下面通过具体实施例,并结合附图,对本发明的具体实施方式作进一步具体说明。
本发明是这样来工作和实施的,如图1所示,一种基于W-LSTM的非参数负荷区间预测方法,其特征是:包括步骤:
步骤一,对收集的电力负荷时间序列数据集进行缺失值填补、异常值剔除的预处理;
步骤二,将完成预处理的电力负荷时间序列数据集转换为监督学习数据集;
步骤三,并使用离散小波变换提取电力负荷时间序列的特征向量;
步骤四,将离散小波变换提取得到的特征向量输入以LQD损失函数训练的LSTM神经网络,得到电力负荷非参数区间预测结果。
进一步地,所述步骤一中时间序列数据集进行缺失值填补的方法为:
判断缺失数据类型,如果是单点数据缺失,则使用缺失数据前一个时间点和缺失数据后一个时间点的数据平均值填补缺失数据;
如果连续多个时间点的数据值均为缺失,即某个时间段的数据值缺失,则使用整个时间序列数据集中相同时间段的数据值的平均值填补缺失时间段的数据值。
进一步地,所述步骤一中对收集的电力负荷时间序列数据集进行缺失值填补、异常值剔除的预处理,具体步骤包括:
对于缺失数据,使用缺失数据前后时间点的数据平均值填补缺失数据:
对于异常数据,使用数据变化率来剔除异常值:
式中,rt时间点t电力负荷的变换率,pt、pt-1分别代表时间点t和时间点t-1的电力负荷数据值。
如果某个时间点的电力负荷变化率大于0.8则认为该时间点的电力负荷数据值为异常值。对于异常数据点,使用异常数据点前后时间点的数据平均值替代异常数据。
进一步地,所述步骤二中,将完成预处理的电力负荷时间序列数据集转换为监督学习数据集,具体步骤包括:
得到完成预处理的电力负荷时间序列后,以过去12个时间点的电力负荷大小为预测模型的输入xi={pt-12,pt-11,pt-10,…,pt-1},以当前时间点的电力负荷大小为标签yi={pt},得到(xi,yi)这样成对的监督学习数据集。
进一步地,所述步骤三中,使用离散小波变换提取电力负荷时间序列的特征向量,具体步骤包括:得到模型输入xi={pt-12,pt-11,pt-10,…,pt-1}后,使用多级离散小波变换从电力负荷时间序列数据中提取特征向量,将提取得到的第m级低频分量和第m级高频分量分别记为xl(m)和xh(m)。其中第m+1级变换是将第m级变换得到的低频分量分别送入一个低通滤波器l={l1,…,lk,…,lK}和一个高通滤波器h={h1,…,hk,…,hK}:
经过i次变换后,可以提取得到一个特征向量序列:
Fi={xh(1),xh(2),…,xh(m),xl(m)} (5)
在LSTM神经网络的基础上采用多级离散小波变化将原始负荷时间序列分解为了多个高频分量和一个低频分量,帮助LSTM神经网络在不同频域挖掘负荷的时序特征,提高预测性能。
进一步地,所述步骤四中,将离散小波变换提取得到的特征向量输入以LQD损失函数训练的LSTM神经网络,得到电力负荷非参数区间预测结果,具体步骤包括:
式中,Pr()代表满足括号中条件的概率。对于n组输入与标签对应的样本,用ki代表第i个样本的标签值是否落入给出的预测区间中:
定义c为n组样本中,标签值落入给出预测区间内的数量:
则预测区间的覆盖率可以表示为:
包含标签值的预测区间的平均宽度可以表示为:
一个好的预测区间,一方面应该尽可能保证区间覆盖率PICP接近理论置信度(1-α),同时也应该尽可能保证预测区间平均宽度MPIW越小,因此将损失函数LQD定义为:
式中,MPIW代表含标签值的预测区间平均宽度,应该越小越好,λ代表权重系数,本申请取1,n代表样本数量,(1-α)代表理论置信度,PICP代表预测区间覆盖率。
以LQD损失函数训练的LSTM神经网络方法为:
将电力负荷时间序列数据集转换得到的监督学习数据集按照8:2划分为训练集和测试集,其中训练集用来训练LSTM神经网络模型,测试集用来测试LSTM神经网络模型区间预测性能。
LSTM神经网络是在循环神经网络的基础上改进得到,一定程度上解决了循环神经网络梯度爆照和梯度消失的问题,其表达式为:
Ct=ftCt-1+it tanh(WC·[ht-1,xt]+bC) (12)
it=σ(Wi·[ht-1,xt]+bi) (13)
it=σ(Wi·[ht-1,xt]+bi) (14)
ft=σ(Wf·[ht-1,xt]+bf) (15)
ot=σ(Wo[ht-1,xt]+bo) (16)
式中,xt代表多级离散小波变换提取的特征向量,it是输入门,ft是遗忘门,ht-1是上一个时间点的输出,Ct-1是上一个时间点的记忆,ht是当前时间点的输出,Ct是当前时间点的记忆。W代表权重矩阵参数,b是偏置项,σ和tanh分别是sigmoid和tanh激活函数。
同时使用LQD损失函数便捷有效的帮助LSTM神经网络模型实现了电力负荷非参数区间预测;预测区间的覆盖率越接近理论置信度越好,平均宽度越小越好,因此本发明设计一个损失函数,是平均宽度+系数*(理论置信度-实际区间覆盖率)^2。训练是让损失函数变小,这一过程中,平均宽度变小,理论置信度和实际区间覆盖率越来越接近。
现用一个实例来验证本申请所提电力负荷非参数区间预测的结果是准确的,收集一个电力负荷时间序列数据集后,按8:2的比例划分训练集与测试集,使用训练集训练LSTM模型,使用测试集验证模型区间预测精度。附图2展示了测试集连续一周电力负荷90%置信度的区间预测结果,图中散点代表实际电力负荷大小,上方曲线和下方曲线分别代表预测区间的上界与下界,从图中可以看出,预测的90%置信度预测区间准确的实现了电力负荷区间预测。表1展示了本发明所述方法和传统的LSTM-LQD、常见的分位数LSTM覆盖率和平均宽度两个指标的对比,可以看出在覆盖率基本相同时,本专利所提方法区间的平均宽度更低,说明了本发明所述方法的优越性。
表1
方法 | 覆盖率 | 平均宽度 |
本发明W-LSTM-LQD方法 | 91.32% | 2.37 |
传统LSTM-LQD方法 | 90.47% | 2.43 |
常见分位数LSTM方法 | 90.50% | 2.49 |
综上,本发明首先对收集到的电力负荷时间序列数据集进行缺失值补全、异常值剔除等预处理;然后将完成预处理的电力负荷时间序列数据转换为监督学习数据集,并使用多级离散小波变换从原始输入的电力负荷时间序列中提取特征向量;最后以提取的特征向量作为LSTM神经网络的输入,使用LQD损失函数训练LSTM神经网络,实现了精度更高的电力负荷非参数区间预测。
需要声明的是,上述具体实施方式仅仅为本发明的较佳实施例及所运用技术原理。本领域技术人员应该明白,还可以对本发明做各种修改、等同替换、变化等等。但是,这些变换只要未背离本发明的精神,都应在本发明的保护范围之内。另外,本发明说明书和权利要求书所使用的一些术语并不是限制,仅仅是为了便于描述。
Claims (7)
1.一种基于W-LSTM的非参数负荷区间预测方法,其特征在于:包括
步骤一,对收集的电力负荷时间序列数据集进行缺失值填补、异常值剔除的预处理;
步骤二,将完成预处理的电力负荷时间序列数据集转换为监督学习数据集;
步骤三,使用离散小波变换提取电力负荷时间序列的特征向量;
步骤四,将离散小波变换提取得到的特征向量输入以LQD损失函数训练的LSTM神经网络,得到电力负荷非参数区间预测结果。
2.根据权利要求1所述一种基于W-LSTM的非参数负荷区间预测方法,其特征在于:所述步骤一中时间序列数据集进行缺失值填补的方法为:
判断缺失数据类型,如果是单点数据缺失,则使用缺失数据前一个时间点和缺失数据后一个时间点的数据平均值填补缺失数据;
如果连续多个时间点的数据值均为缺失,即某个时间段的数据值缺失,则使用整个时间序列数据集中相同时间段的数据值的平均值填补缺失时间段的数据值。
4.根据权利要求1所述一种基于W-LSTM的非参数负荷区间预测方法,其特征是:所述步骤二中完成预处理的电力负荷时间序列数据集转换为监督学习数据集的方法为:
得到完成预处理的电力负荷时间序列后,以过去12个时间点的电力负荷大小为预测模型的输入xi={pt-12,pt-11,pt-10,...,pt-1},以当前时间点的电力负荷大小为标签yi={pt},得到(xi,yi)这样成对的监督学习数据集。
5.根据权利要求1所述一种基于W-LSTM的非参数负荷区间预测方法,其特征在于:所述步骤三中使用离散小波变换提取电力负荷时间序列的特征向量方法为:
得到模型输入xi={pt-12,pt-11,pt-10,…,pt-1}后,使用多级离散小波变换从电力负荷时间序列数据中提取特征向量,将提取得到的第m级低频分量和第m级高频分量分别记为xl(m)和xh(m)。其中第m+1级变换是将第m级变换得到的低频分量分别送入一个低通滤波器l={l1,...,lk,...,lK}和一个高通滤波器h={h1,...,hk,...,hK}:
经过i次变换后,可以提取得到一个特征向量序列:
Fi={xh(1),xh(2),...,xh(m),xl(m)} (5)
6.根据权利要求1所述一种基于W-LSTM的非参数负荷区间预测方法,其特征是:所述步骤四中LQD损失函数为:
式中,Pr()代表满足括号中条件的概率,对于n组输入与标签对应的样本,用ki代表第i个样本的标签值是否落入给出的预测区间中:
定义c为n组样本中,标签值落入给出预测区间内的数量:
则预测区间的覆盖率可以表示为:
包含标签值的预测区间的平均宽度可以表示为:
将损失函数LQD定义为:
式中,MPIW代表含标签值的预测区间平均宽度,应该越小越好,λ代表权重系数,本申请取1,n代表样本数量,(1-α)代表理论置信度,PICP代表预测区间覆盖率。
7.根据权利要求1所述一种基于W-LSTM的非参数负荷区间预测方法,其特征在于:所述步骤四中以LQD损失函数训练的LSTM神经网络,得到电力负荷非参数区间预测结果方法为:
将电力负荷时间序列数据集转换得到的监督学习数据集按照8:2划分为训练集和测试集,其中训练集用来训练LSTM神经网络模型,测试集用来测试LSTM神经网络模型区间预测性能;
LSTM神经网络是在循环神经网络的基础上改进得到,其表达式为:
Ct=ftCt-1+ittanh(WC·[ht-1,xt]+bC) (12)
it=σ(Wi·[ht-1,xt]+bi) (13)
it=σ(Wi·[ht-1,xt]+bi) (14)
ft=σ(Wf·[ht-1,xt]+bf) (15)
ot=σ(Wo[ht-1,xt]+bo) (16)
式中,xt代表多级离散小波变换提取的特征向量,it是输入门,ft是遗忘门,ht-1是上一个时间点的输出,Ct-1是上一个时间点的记忆,ht是当前时间点的输出,Ct是当前时间点的记忆。W代表权重矩阵参数,b是偏置项,σ和tanh分别是sigmoid和tanh激活函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310348675.4A CN116384574A (zh) | 2023-04-03 | 2023-04-03 | 一种基于w-lstm的非参数负荷区间预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310348675.4A CN116384574A (zh) | 2023-04-03 | 2023-04-03 | 一种基于w-lstm的非参数负荷区间预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116384574A true CN116384574A (zh) | 2023-07-04 |
Family
ID=86962917
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310348675.4A Withdrawn CN116384574A (zh) | 2023-04-03 | 2023-04-03 | 一种基于w-lstm的非参数负荷区间预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116384574A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117977579A (zh) * | 2024-03-28 | 2024-05-03 | 西华大学 | 基于dwt-lstm神经网络的可调节负荷预测方法 |
-
2023
- 2023-04-03 CN CN202310348675.4A patent/CN116384574A/zh not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117977579A (zh) * | 2024-03-28 | 2024-05-03 | 西华大学 | 基于dwt-lstm神经网络的可调节负荷预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111091233B (zh) | 一种风电场短期风电预测建模方法 | |
CN101414366B (zh) | 基于改进极端学习机方法的电力系统短期负荷预测方法 | |
CN110232483B (zh) | 深度学习负荷预测方法、装置及终端设备 | |
CN111401755B (zh) | 基于马尔科夫链的多新能源出力场景生成方法、装置及系统 | |
CN104166787A (zh) | 一种基于多阶段信息融合的航空发动机剩余寿命预测方法 | |
CN111738520A (zh) | 一种融合孤立森林与长短期记忆网络的系统负载预测方法 | |
CN114358389B (zh) | 结合vmd分解和时间卷积网络的短期电力负荷预测方法 | |
CN116565863B (zh) | 一种基于时空相关性的短期光伏出力预测方法 | |
CN111241755A (zh) | 电力负荷预测方法 | |
CN114548586B (zh) | 一种基于混合模型的短期电力负荷预测方法及系统 | |
CN113449919B (zh) | 一种基于特征和趋势感知的用电量预测方法及系统 | |
CN116502774B (zh) | 一种基于时间序列分解和勒让德投影的时间序列预测方法 | |
CN116384574A (zh) | 一种基于w-lstm的非参数负荷区间预测方法 | |
CN114254695A (zh) | 一种航天器遥测数据自适应异常检测方法及装置 | |
CN115456306A (zh) | 一种母线负荷预测方法、系统、设备及存储介质 | |
CN110222840B (zh) | 一种基于注意力机制的集群资源预测方法和装置 | |
CN110766215B (zh) | 基于特征自适应选择和wdnn的风电爬坡事件预测方法 | |
CN116169670A (zh) | 一种基于改进神经网络的短期非居民负荷预测方法及系统 | |
CN113205223A (zh) | 一种电量预测系统及其预测方法 | |
CN113868938A (zh) | 基于分位数回归的短期负荷概率密度预测方法、装置及系统 | |
CN116539994A (zh) | 基于多源时间序列数据的变电站主设备运行状态检测方法 | |
CN116885699A (zh) | 基于双重注意力机制的电力负荷预测方法 | |
CN114239945B (zh) | 短期电力负荷预测方法、装置、设备及存储介质 | |
CN116227738B (zh) | 一种电网客服话务量区间预测方法及系统 | |
CN116739130A (zh) | TCN-BiLSTM网络的多时间尺度负荷预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20230704 |
|
WW01 | Invention patent application withdrawn after publication |