CN113191526B - 基于随机敏感度的短期风速区间的优化预测方法及系统 - Google Patents
基于随机敏感度的短期风速区间的优化预测方法及系统 Download PDFInfo
- Publication number
- CN113191526B CN113191526B CN202110294165.4A CN202110294165A CN113191526B CN 113191526 B CN113191526 B CN 113191526B CN 202110294165 A CN202110294165 A CN 202110294165A CN 113191526 B CN113191526 B CN 113191526B
- Authority
- CN
- China
- Prior art keywords
- interval
- prediction
- wind speed
- optimization
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000035945 sensitivity Effects 0.000 title claims abstract description 62
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000005457 optimization Methods 0.000 claims abstract description 72
- 238000012549 training Methods 0.000 claims abstract description 49
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 24
- 238000013528 artificial neural network Methods 0.000 claims abstract description 22
- 230000006870 function Effects 0.000 claims abstract description 11
- 230000002068 genetic effect Effects 0.000 claims abstract description 5
- 108090000672 Annexin A5 Proteins 0.000 claims description 35
- 238000007781 pre-processing Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 8
- 210000004205 output neuron Anatomy 0.000 claims description 8
- 230000002159 abnormal effect Effects 0.000 claims description 7
- 238000010200 validation analysis Methods 0.000 claims description 6
- 210000002569 neuron Anatomy 0.000 claims description 5
- 230000006399 behavior Effects 0.000 claims description 4
- 238000007429 general method Methods 0.000 claims description 4
- 230000006872 improvement Effects 0.000 claims description 4
- 238000003062 neural network model Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 2
- 238000009826 distribution Methods 0.000 description 5
- 238000000053 physical method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 238000010248 power generation Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003245 coal Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000002803 fossil fuel Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000003345 natural gas Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Tourism & Hospitality (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于随机敏感度的短期风速区间多目标优化预测方法及系统,首先采用反向传播的训练方式对神经网络进行预训练,随后将随机敏感度进行改进以适用于特殊的预测方式——预测区间,再将预测区间的两个重要指标:区间覆盖准确率和区间宽度,与所构造的用于预测区间的随机敏感度作为三个目标函数,使用多目标遗传优化算法NSGA‑III对预训练好的神经网络进行优化,其中随机敏感度可用于计算模型对于添加随机扰动后的周围样本的抗干扰能力;训练完毕后,在最终得到的帕累托最优种群中进行启发式选解。本发明提出的方法可用于不同的网络结构,具有高可扩展性;利用多目标优化和特殊的选取最优解方案,使超参数数量大大减少,具有较好的实际应用价值。
Description
技术领域
本发明涉及智能电网、短期风速区间预测领域,尤其涉及一种基于随机敏感度的短期风速区间多目标优化预测方法及系统。
背景技术
传统上,电力是通过燃烧煤、天然气和石油等化石燃料来生产的。但是,这种发电方式会向环境释放大量有毒物质,不利于人类的可持续发展。近年来,随着先进技术的发展,可再生能源的利用越来越受到人们的重视。目前,风能具有储量大、分布广、取之不尽、用之不竭的特点。与其他能源相比,风能具有最大的发展潜力。尽管风力发电有许多优点,但它具有间歇性和随机性波动。这也使得风能预测成为一个挑战,给风力发电系统的稳定性和安全性带来了很大的困难。
在国内外的现有的研究中,提出了许多风能预测技术,通常分为物理方法、统计方法和人工智能方法。物理方法需要收集气象数据,包括湿度、温度、气压、风速、风向和地形数据,通常称为数值天气预报模型。这些方法的优点是预测精度高,解释性强。缺点是数据收集困难,需要大量的计算和对大气的详细描述。在当前的工业环境中,物理方法被大量使用。虽然物理方法的预测精度高,但是物理方法需要极大的计算能力支持,在某些场景下甚至需要超算作为辅助,并且运行时长也很长。这对于实际工业环境的应用是一个很大的限制。在很多实际情况下,各种物理信息的采集与整理也是比较困难的,并且其在短期风速预测的领域表现比较一般,主要用于中长期风速预测。因此目前业界认为物理模型并不适用于短期风速预测。至今为止,包括中国在内,全世界有三十多个国家和地区使用数值天气预报模型来进行风能预测。
统计方法是数据驱动的,使用从风电场收集的历史时间序列数据来预测未来价值。例如,自回归移动平均模型(ARMA)和自回归综合移动平均模型(ARIMA)。然而,这些时间序列模型是线性的,不能准确预测风速时间序列的非线性和非平稳波动。近年来,许多机器学习技术得到了应用。其中,人工神经网络(ANN)由于能够捕捉历史数据之间的非线性关系,已成为风速预测的常用方法。大多数研究使用浅层人工神经网络,一些研究使用深度学习(DL)来捕捉复杂的非线性特征。近年来,风速数据的预处理也被认为是为了滤除噪声,如经验模态分解(EMD)、电磁模态分解(EEMD)和改进的CEEMDAN(ICEEMDAN)。风速是周期性的,峰值变化很快,所以用正弦激活函数代替了sigmoid激活函数。一些研究将人工神经网络与统计方法相结合来捕捉风速的线性和非线性特征,这些方法提高了短期风速预测的准确性。然而,传统的点预测方法存在预测误差大、预测精度变化大等缺点,在一定的时间步长内只能产生一定的预测值,不存在相关的不确定性。因此,近年来风速预测研究的重点主要集中在区间预测上。区间预测可以更合理地估计潜在的不确定性和风险水平,为电力系统的规划和运行提供更全面的参考。
传统的风速区间预测方法首先在点预测的基础上通过最小化损失函数来训练模型,然后根据训练结果构造预测区间。然而,用这种方法构建的预测区间也会带来一些问题。首先,这些方法需要假设参数分布,如高斯过程和核密度预测方法。然而,实际的数据分布往往不满足假设分布,因此带来很大的误差。其次,这种传统预测区间构建方法的主要策略是最小化预测的误差,而不是提高预测区间的质量。为了克服这些问题,Khosravi提出了一种基于神经网络的上下限估计(LUBE)方法。与传统的基于神经网络的预测区间构造方法相比,该方法不需要假设预测误差的分布,计算速度大大加快。更重要的是,LUBE直接优化了预测区间的质量。此外,已有的研究也从多个方面对预测区间进行了研究。基于单目标框架(如LUBE)的风速区间预测方法可能需要将多个目标组合成一个目标,但无论是加权组合还是指数组合,都需要一些先验知识,并且会引入太多的超参数。也有一些工作将其视为约束单目标优化问题。一些文献提出了预测区间的多目标框架。一些工作集中于神经网络的结构,如RNN、LSTM和GRU网络。虽然这些研究从多方面提高了预测区间的质量,但就目前为止还没有直接优化预测区间的鲁棒性和稳定性的工作。
现有的基于多目标优化的风速区间预测方法大多以预测区间覆盖概率和预测区间宽度或它们的变体为两个优化目标。虽然这可以直接优化预测区间的两个最重要的指标,但是用于风速区间预测的模型可能缺乏稳定性。也就是说,尽管训练模型在训练集中表现良好,但是对于类似于训练样本的未知样本,性能可能会大大降低。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明公开了一种基于随机敏感度的短期风速区间预测方法,所述方法包括如下步骤:
步骤1,将随机敏感度扩展到预测风速区间的领域,提出用于预测风速区间的改进随机敏感度,以用于衡量模型的稳定性与鲁棒性;
步骤2,对采集的数据进行数据预处理以及特征工程;
步骤3,定义神经网络的结构,并对模型进行预训练,使初始解落在一个较好的区域;
步骤4,将预测区间覆盖概率、预测区间宽度与用于预测风速区间的所述改进随机敏感度作为三个优化目标,使用多目标遗传优化算法NSGA-III进行多目标优化,得到帕累托最优种群;其中所述NSGA-III优化的是所述步骤3中得到的初始解的权重参数,所述初始解的权重参数范围在[-1,1],目的是使问题更容易收敛并且对不同问题具有泛化性,最后,再从所述帕累托最优种群中得到最优解。
进一步地,所述步骤1具体包括:对传统随机敏感度计算方法进行改进,使其能够适用于在短期风速预测问题中较为重要的区间预测问题,首先需要对随机敏感度进行扩展,使其自然地应用于预测区间,因此,提出了用于预测风速区间的随机敏感度SS_PIs定义如下:
其中x代表训练样本,x、xp、β分别表示给定的训练样本、给定训练样本周围的第p个扰动样本、扰动样本的总数量,s(x,xp)的定义如下:
其中y表示样本x的标签,L(x)和U(x)分别表示样本x的预测区间的下界和上界,c(x)表示样本x的预测区间的命中情况,c(xp)表示扰动样本xp的预测区间的命中情况。扰动样本xp应与样本x具有相同的标签y,所以当c(x)等于c(xp)时,s(x,xp)=0,否则s(x,xp)=1,式(3)中定义了c,当y落在预测区间中时,c(x)=1,否则c(x)=0;
对于训练样本x,SS_PIs生成β个扰动样本xp(p∈[1,β]),通过比较x和xp的覆盖情况,训练样本x中模型的随机敏感度为覆盖行为与x不一致的扰动样本数除以扰动样本总数β,在区间预测问题中,SS_PIs度量了模型的稳定性和鲁棒性,SS_PIs(x)越大,模型鲁棒性越差。
进一步地,所述步骤2具体包括:为了减少数据的噪声,以及使模型更容易学习,需要进行数据的预处理和特征工程;
所述数据的预处理,包括对异常数据进行删除,所述异常数据包括缺失值和/或过大的值;
所述特征工程,对于短期风速区间预测,取过去一小时的数据作为特征,将过去一小时采集到的风速源数据作为一部分特征,另外,为了使模型更加容易学习,还需要手动提取过去一小时风速数据的统计特征,包含均值,方差,最大值,最小值,总和。
进一步地,所述步骤3具体包括:为适应预测区间对神经网络进行了设计,使输出层的两个神经元可以作为预测区间的上下界;为了使多目标优化算法更容易收敛到较好的种群,预先对网络进行训练,其中网络的中间层结构可以任意设计,使得所提出的方法可以很好地迁移到不同的网络结构上面,从而作为一个通用的方法被使用;初始解的算法如下:
(1)随机初始化网络的参数;
(2)将网络的两个输出神经元的目标输出都设置为当前样本的标签;
(3)损失函数定义为两个输出神经元的均方误差之和,再使用传统的优化算法对模型进行优化
进一步地,所述步骤4具体包括:构造一种基于预测区间覆盖概率,预测区间归一化平均宽度与预测风速区间的随机敏感度三个目标函数的优化方程,如下所示:
式中,ω是用于风速区间预测的模型的权重,PICP和PINAW分别是预测区间覆盖概率、预测区间归一化平均宽度,
利用多目标优化方程和初始解,NSGA-III可以对优化目标进行优化,NSGA-III不直接优化初始解,而是优化初始解的系数,将NSGA-III的优化变量控制在一个固定的范围内[-1,1],不考虑初始解本身的大小,同时,减小搜索空间,如下式所示:
ω=ω0w (5)
其中ω0表示网络预训练后得到的解,将其称为初始解,w表示ω0的系数,也是NSGA-III的优化变量,经过NSGA-III优化,得到一组帕累托最优解Ω。
将Ω应用于验证集以获得平均PICP和PINAW,然后使用这两个值来获得最优解,为避免引入参数,不采用将PICP和PINAW结合为一个目标,而是根据单个目标从Ω中选择最优解的方法:
s.t.PICP(ω)>=PINC (6)
其中,PICP(ω)和PINAW(ω)表示参数为ω的验证集上的平均PICP和PINAW,PINC表示预测区间置信水平,其代表实际需求中希望PICP能达到的数值。最后的最优解是w*,神经网络的最佳参数可以通过w*乘以初始解ω0得到。
本发明进一步公开了一种基于随机敏感度的短期风速区间多目标优化预测系统,所述系统包括:
随即敏感度改进模块,将随机敏感度扩展到预测风速区间的领域,提出用于预测风速区间的改进随机敏感度,以用于衡量模型的稳定性与鲁棒性;
数据处理模块,对采集的数据进行数据预处理以及特征工程;
神经网络模型训练模块,定义神经网络的结构,并对模型进行预训练,使初始解落在一个较好的区域;
多目标优化最优解模块,将预测区间覆盖概率、预测区间宽度与用于预测风速区间的所述改进随机敏感度作为三个优化目标,使用多目标遗传优化算法NSGA-III进行多目标优化,得到帕累托最优种群;其中所述NSGA-III优化的是所述步骤3中得到的初始解参数,所述初始解参数的范围在[-1,1],目的是使问题更容易收敛并且对不同问题具有泛化性,最后,再从所述帕累托最优种群中得到最优解。
采用本发明产生的有益效果在于:
(1)本发明提出的方法可用于不同的网络结构,具有高可扩展性;
(2)利用多目标优化和特殊的选取最优解方案,使超参数数量大大减少,具有较好的实际应用价值;
(3)基于区间预测的技术思想,使用区间预测方案替代点预测方案,使该方案更加符合实际任务环境的需求;
(4)基于随机敏感度的技术思想,将用于点预测的随机敏感度扩展到了预测区间领域,使其能够简单迁移到区间预测领域;
(5)基于NSGA-III进行多目标优化,将预测区间覆盖概率,预测区间宽度与用于预测区间的随机敏感度作为三个优化目标,通过添加随机敏感度增强了模型的泛化能力,增强预测区间的性能,具有较好敏感度的模型也具有较好的稳定性和鲁棒性,大大提高风速区间预测的模型的稳定性。
附图说明
从以下结合附图的描述可以进一步理解本发明。
图1为本发明逻辑流程示意图。
图2为本发明所使用的神经网络结构示意图。
图3为本发明所得到的模型在测试集上的帕累托示意图(只观察预测区间覆盖概率和预测区间归一化平均宽度)。
图4为本发明所构造的预测区间覆盖情况示意图。
具体实施方式
实施例一
本发明是一种基于随机敏感度的短期风速区间多目标优化预测方法及系统,整体流程如图1所示。其包括如下步骤:
步骤1,将传统的随机敏感度扩展到预测区间的领域,提出针对预测区间问题的改进随机敏感度,以用于衡量模型的稳定性与鲁棒性。
步骤2,数据预处理以及特征工程。
步骤3,定义神经网络的结构,并对模型进行预训练,使初始解落在一个较好的区域。
步骤4,将预测区间覆盖概率,预测区间宽度与用于预测区间的随机敏感度作为三个优化目标,使用NSGA-III进行多目标优化,得到帕累托最优种群。其中NSGA-III优化的是步骤2得到的初始解参数,参数的范围在[-1,1],目的是使问题更容易收敛并且对不同问题具有泛化性。最后,再从种群中得到最优解。
所述步骤4其特征在于,将预测区间覆盖概率,预测区间宽度与用于预测区间的随机敏感度作为三个优化目标,使用NSGA-III进行多目标优化,得到帕累托种群。其中NSGA-III学习的是步骤2得到的初始解的参数,范围在[-1,1],目的是使问题更容易收敛并且对不同问题具有泛化性。之后,再从种群中得到最优解。
对于步骤1中,随机敏感度(Stochastic Sensitivity,SS)通过对特征添加微小的扰动,然后计算模型的平均输出偏差。SS由模型的平均输出偏差来定义。如果模型的输出受到微小扰动的强烈干扰,则模型的稳定性和鲁棒性较弱,即模型对未来未知样本的泛化能力较弱。
SS定义为随机扰动样本的预测值与标签的平均差,公式如下:
其中x、xp、y、β和h(·)分别表示给定的训练样本、给定训练样本周围的第p个扰动样本、给定训练样本的真实标签、扰动样本的总数量和模型h的预测值。扰动样本是通过在训练样本的输入中加入小的扰动来产生的,这些样本位于同一个邻域,称之为Q-邻域。x的Q-邻域定义如下:
SQ(x)={xp|xp=x+Δx,|Δxi|≤Q,i=1,2,…,n} (2)
其中,Δx,Δxi,Q,n分别表示对训练样本的扰动程度、对训练样本第i维度的特征上的扰动程度、最大扰动程度和样本x的特征维数。
对于标准化为[0,1]的数据集,Q=0.1意味着最大扰动可以偏离训练样本10%的程度。由于具有良好泛化能力的模型对小扰动具有较强的鲁棒性,因此训练样本的Q-邻域中的样本应具有与训练样本相同的标签。
上述方法仅适用于传统的点预测。将随机敏感度应用于区间预测,需要对随机敏感度进行扩展,使其自然地应用于预测区间。因此,本发明提出了用于预测区间的随机敏感度SS_PIs定义如下:
其中x代表训练样本,xp和β的定义与上述相同,s(x,xp)的定义如下:
其中y表示样本x的标签,L(x)和U(x)分别表示样本x的预测区间的下界和上界。扰动样本xp应与样本x具有相同的标签y。所以当c(x)等于c(xp)时,s(x,xp)=0,否则s(x,xp)=1。式(5)中定义了c。当y落在预测区间中时,c(x)=1,否则c(x)=0。
对于训练样本x,SS_PIs生成β个扰动样本xp(p∈[1,β])。通过比较x和xp的覆盖情况,样本x中模型的随机敏感度为覆盖行为与x不一致的扰动样本数除以扰动样本总数β。在区间预测问题中,SS_PIs度量了模型的稳定性和鲁棒性。SS_PIs(x)越大,模型鲁棒性越差。
为了减少数据的噪声,以及使模型更容易学习,需要进行数据的预处理和特征工程。
数据的预处理阶段,需要对异常数据进行删除,比如缺失值和过大的值。
特征工程阶段,由过往的文献可知,对于短期风速区间预测,取过去一小时的数据作为特征是一种可行的做法。因此将过去一小时采集到的风速源数据作为一部分特征。除此之外,为了使模型更加容易学习,手动提取了一些过去一小时风速数据的统计特征,包含均值,方差,最大值,最小值,总和。
对于步骤3,为适应预测区间对神经网络进行了设计,使输出层的两个神经元刚好可以当做预测区间的上下界;为了使多目标优化算法更容易收敛到较好的种群,预先对网络进行了训练。
网络的结构如图2所示,其中唯一需要限制的只有输出层需要两个神经元,网络的中间层结构可以任意设计,这使得所提出的方法可以很好地迁移到不同的网络结构上面,从而作为一个通用的方法被使用。
因为NSGA-III等多目标优化算法是在初始解的基础上进行探索性迭代更新,并逐渐找到更好的解。因此,一个好的初始解有助于找到一个更好的最终解。确定本发明初始解的算法如下:
(1)随机初始化网络的参数
(2)将网络的两个输出神经元的目标输出都设置为当前样本的标签
(3)损失函数定义为两个输出神经元的均方误差之和,再使用传统的优化算法(如反向传播算法)对模型进行优化。
对于步骤4,将预测区间覆盖概率,预测区间宽度与用于预测区间的随机敏感度作为三个优化目标,使用NSGA-III进行多目标优化,得到帕累托最优种群。其中NSGA-III优化的是步骤3得到的初始解的参数,范围在[-1,1],目的是使问题更容易收敛并且对不同问题具有泛化性。最后,再从种群中挑选得到最优解。
在传统方法中,有两个最重要的评价指标,即预测区间覆盖概率PICP和预测区间归一化平均宽度PINAW。
预测区间覆盖概率通常被认为是预测区间的一个非常重要的指标,它代表了预测区间的精度,即目标值被预测区间上下界覆盖的概率。PICP越大意味着在构建的预测区间中有更多的目标值。PICP的定义如下:
其中N是样本数,ci是一个布尔变量,表示第i个样本的覆盖行为。如果目标值yi介于第i个预测区间的上限Ui和下限Li之间,则ci=1;否则,ci=0。从数学上讲,ci可以定义为:
PICP越高并不一定越好,因为这可能导致预测区间变得很宽。假设预测区间的宽度是无限的,PICP就肯定是100%,但这不是我们想要的高质量预测区间。因此除了考虑PICP外,还应考虑预测区间的宽度。在以前的工作中,预测区间的宽度被定义为预测的区间归一化平均宽度(PINAW),其定义如下:
其中R是目标的范围(训练样本中最大值减去最小值)。R可以将预测区间的平均宽度(%)标准化,以便对不同的场景进行客观比较。
在实践中,具有较大PICP和较窄的PINAW是很重要的。理论上,这两个目标是相互冲突的。减小预测区间的宽度通常会导致PICP的降低,这是由于一些预测区间观测值的丢失。如果PICP比PINC小得多,那么构造的预测区间是完全不可靠的。因此,优秀的预测区间应使PICP尽可能接近预测区间置信水平(1-α)%,α表示出错概率,同时PINAW应尽可能小。其中预测区间置信水平表示实际需求中所希望达到的覆盖概率。
本文构造了一种基于预测区间覆盖概率,预测区间归一化平均宽度与预测区间的随机敏感度三个目标函数的优化方程。如下所示:
式中,ω是用于风速区间预测的模型的权重。PICP和PINAW是评价预测区间质量的两个重要指标。使用这两个指标可以构造一个在训练集中表现最好的PI,但是对于未知样本,性能不一定是最好的。也就是说,这种方法可能出现过拟合现象,对未知样本的泛化能力很弱。SS_PIs表示本文为预测区间构造的随机敏感度,计算公式如(3)所示。本专利提出了基于随机敏感度的多目标优化方法。它不仅以PICP和PINAW为优化目标,而且以SS_PIs为第三个优化目标,寻求一个同时具有预测区间质量和泛化能力的最优解。
利用多目标优化方程和初始解,NSGA-III可以对优化目标进行优化。需要注意的是,NSGA-III不直接优化初始解,而是优化初始解的系数。该方法的优点是可以将NSGA-III的优化变量控制在一个固定的范围内,如[-1,1],不考虑初始解本身的大小。同时,减少了解的搜索空间,便于算法寻找最优解。如下式所示:
ω=ω0w (10)
其中ω0表示网络预训练后得到的解,将其称为初始解,w表示ω0的系数,也是NSGA-III的优化变量。
经过NSGA-III优化,得到一组帕累托最优解Ω。如图3所示,在我们的实验中,每种方法的种群有100个个体。由于本发明所提出的方法有三个优化目标,当只考虑PICP和PINAW时,本发明得到的解不一定是帕累托最优解。所以图中的曲线不是完全单调的。可以看出,在我们主要关注的高PICP区间,本发明的PINAW非常小。结果表明,该方法能有效地提高泛化能力,获得高质量的PIs。
实施例二
当NSGA-III优化结束后,本发明需要做的最后一件事是从Ω中选择最符合当前需求的解决方案。SS_PIs在训练阶段用来提高模型的鲁棒性和稳定性,而在测试阶段,PICP和PINAW直接关系到预测区间的质量。因此,在从Ω中选择最优解时,我们主要考虑PICP和PINAW。将Ω应用于验证集以获得平均PICP和PINAW,然后使用这两个值来获得最优解。为避免引入参数,该方法不采用将PICP和PINAW结合为一个目标,而是根据单个目标从Ω中选择最优解的方法:
s.t.PICP(ω)>=PINC (11)
PICP(ω)和PINAW(ω)表示参数为ω的验证集上的平均PICP和PINAW。最后的最优解是w*。神经网络的最佳参数可以通过w*乘以初始解ω0得到。
最终模型得到的结果可以从图4中看到,附图4中上面那副图代表预测区间置信水平为80%时预测区间的覆盖情况,而下面那幅图代表预测区间置信水平为95%时预测区间的覆盖情况。图中的横坐标可以代表时间,单位是10分钟一条样本;纵坐标是风速,单位是米/秒。从图4中可以看出,本发明所提出的方法构造的预测区间可以有效覆盖真实目标,并且当预测区间置信水平提高时,也就是实际需求对准确率要求更加严格时,所构造的预测区间会相对的变宽。这是符合预期的,适当地提高预测区间的宽度,可以带来更大的预测覆盖准确率。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
虽然上面已经参考各种实施例描述了本发明,但是应当理解,在不脱离本发明的范围的情况下,可以进行许多改变和修改。因此,其旨在上述详细描述被认为是例示性的而非限制性的,并且应当理解,以下权利要求(包括所有等同物)旨在限定本发明的精神和范围。以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。
Claims (3)
1.一种基于随机敏感度的短期风速区间多目标优化预测方法,所述方法包括如下:
步骤1,将随机敏感度扩展到预测风速区间的领域,通过改进随机敏感度来预测风速区间,以用于衡量模型的稳定性与鲁棒性,其中,所述改进随机敏感度为对传统随机敏感度计算方法进行改进,使其能够适用于在短期风速预测问题中较为重要的区间预测问题,首先需要对随机敏感度进行扩展,使其自然地应用于预测区间,因此,提出了用于预测风速区间的随机敏感度SS_PIs定义如下:
其中x代表训练样本,x、xp、β分别表示给定的训练样本、给定训练样本周围的第p个扰动样本、扰动样本的总数量,s(x,xp)的定义如下:
其中y表示样本x的标签,L(x)和U(x)分别表示样本x的预测区间的下界和上界,c(x)表示样本x的预测区间的命中情况,c(xp)表示扰动样本xp的预测区间的命中情况;扰动样本xp应与样本x具有相同的标签y,所以当c(x)等于c(xp)时,s(x,xp)=0,否则s(x,xp)=1,式(3)中定义了c,当y落在预测区间中时,c(x)=1,否则c(x)=0;
对于训练样本x,SS_PIs生成β个扰动样本xp(p∈[1,β]),通过比较x和xp的覆盖情况,训练样本x中模型的随机敏感度为覆盖行为与x不一致的扰动样本数除以扰动样本总数β,在区间预测问题中,SS_PIs度量了模型的稳定性和鲁棒性,SS_PIs(x)越大,模型鲁棒性越差;
步骤2,对采集的数据进行数据预处理以及特征工程,其中,为了减少数据的噪声,以及使模型更容易学习,需要进行数据的预处理和特征工程;
所述数据的预处理,包括对异常数据进行删除,所述异常数据包括缺失值和/或过大的值;
所述特征工程,对于短期风速区间预测,取过去一小时的数据作为特征,将过去一小时采集到的风速源数据作为一部分特征,另外,为了使模型更加容易学习,还需要手动提取过去一小时风速数据的统计特征,包含均值,方差,最大值,最小值,总和;
步骤3,定义神经网络的结构,并对模型进行预训练,使初始解落在一个较好的区域,其中,为适应预测区间对所述神经网络进行了设计,使输出层的两个神经元可以作为预测区间的上下界;为了使多目标优化算法更容易收敛到较好的种群,预先对网络进行训练,其中网络的中间层结构可以任意设计,使得所提出的方法可以很好地迁移到不同的网络结构上面,从而作为一个通用的方法被使用;初始解的算法如下:
(1)随机初始化网络的参数;(2)将网络的两个输出神经元的目标输出都设置为当前样本的标签;
(3)损失函数定义为两个输出神经元的均方误差之和,再使用传统的优化算法对模型进行优化,其中,所述传统的优化算法为反向传播算法;
步骤4,将预测区间覆盖概率、预测区间宽度与用于预测风速区间的所述改进随机敏感度作为三个优化目标,使用多目标遗传优化算法NSGA-III进行多目标优化,得到帕累托最优种群;其中所述NSGA-III优化的是所述步骤3中得到的初始解的权重参数,所述初始解的权重参数范围在[-1,1],目的是使问题更容易收敛并且对不同问题具有泛化性,最后,再从所述帕累托最优种群中得到最优解。
2.根据权利要求1所述的一种基于随机敏感度的短期风速区间多目标优化预测方法,其特征在于,
所述步骤4具体包括:构造一种基于预测区间覆盖概率,预测区间归一化平均宽度与预测风速区间的随机敏感度三个目标函数的优化方程,如下所示:
优化目标:找到最优解ω*
最小化:PINAW(ω)
1-PICP(ω)(4)
SS_PIs(ω)
式中,ω是用于风速区间预测的模型的权重,PICP和PINAW分别是预测区间覆盖概率、预测区间归一化平均宽度,
利用多目标优化方程和初始解,NSGA-III可以对优化目标进行优化,NSGA-III不直接优化初始解,而是优化初始解的系数,将NSGA-III的优化变量控制在一个固定的范围内[-1,1],不考虑初始解本身的大小,同时,减小搜索空间,如下式所示:
ω=ω0w (5)
其中ω0表示网络预训练后得到的解,将其称为初始解,w表示ω0的系数,也是NSGA-III的优化变量,经过NSGA-III优化,得到一组帕累托最优解Ω;
将Ω应用于验证集以获得平均PICP和PINAW,然后使用这两个值来获得最优解,为避免引入参数,不采用将PICP和PINAW结合为一个目标,而是根据单个目标从Ω中选择最优解的方法:
s.t.PICP(ω)>=PINC (6)
其中,PICP(ω)和PINAW(ω)表示参数为ω的验证集上的平均PICP和PINAW,PINC表示预测区间置信水平,其代表实际需求中希望PICP能达到的数值,最后的最优解是w*,神经网络的最佳参数可以通过w*乘以初始解ω0得到。
3.一种基于随机敏感度的短期风速区间多目标优化预测系统,所述系统包括:
随即敏感度改进模块,将随机敏感度扩展到预测风速区间的领域,通过改进随机敏感度来预测风速区间,以用于衡量模型的稳定性与鲁棒性,其中,所述改进随机敏感度为对传统随机敏感度计算方法进行改进,使其能够适用于在短期风速预测问题中较为重要的区间预测问题,首先需要对随机敏感度进行扩展,使其自然地应用于预测区间,因此,提出了用于预测风速区间的随机敏感度SS_PIs定义如下:
其中x代表训练样本,x、xp、β分别表示给定的训练样本、给定训练样本周围的第p个扰动样本、扰动样本的总数量,s(x,xp)的定义如下:
其中y表示样本x的标签,L(x)和U(x)分别表示样本x的预测区间的下界和上界,c(x)表示样本x的预测区间的命中情况,c(xp)表示扰动样本xp的预测区间的命中情况;扰动样本xp应与样本x具有相同的标签y,所以当c(x)等于c(xp)时,s(x,xp)=0,否则s(x,xp)=1,式(3)中定义了c,当y落在预测区间中时,c(x)=1,否则c(x)=0;
对于训练样本x,SS_PIs生成β个扰动样本xp(p∈[1,β]),通过比较x和xp的覆盖情况,训练样本x中模型的随机敏感度为覆盖行为与x不一致的扰动样本数除以扰动样本总数β,在区间预测问题中,SS_PIs度量了模型的稳定性和鲁棒性,SS_PIs(x)越大,模型鲁棒性越差;
数据处理模块,对采集的数据进行数据预处理以及特征工程,其中,为了减少数据的噪声,以及使模型更容易学习,需要进行数据的预处理和特征工程,所述数据的预处理,包括对异常数据进行删除,所述异常数据包括缺失值和/或过大的值;
所述特征工程,对于短期风速区间预测,取过去一小时的数据作为特征,将过去一小时采集到的风速源数据作为一部分特征,另外,为了使模型更加容易学习,还需要手动提取过去一小时风速数据的统计特征,包含均值,方差,最大值,最小值,总和;
神经网络模型训练模块,定义神经网络的结构,并对模型进行预训练,使初始解落在一个较好的区域,其中,为适应预测区间对所述神经网络进行了设计,使输出层的两个神经元可以作为预测区间的上下界;为了使多目标优化算法更容易收敛到较好的种群,预先对网络进行训练,其中网络的中间层结构可以任意设计,使得所提出的方法可以很好地迁移到不同的网络结构上面,从而作为一个通用的方法被使用;初始解的算法如下:
(1)随机初始化网络的参数;(2)将网络的两个输出神经元的目标输出都设置为当前样本的标签;
(3)损失函数定义为两个输出神经元的均方误差之和,再使用传统的优化算法对模型进行优化,其中,所述传统的优化算法为反向传播算法;
多目标优化最优解模块,将预测区间覆盖概率、预测区间宽度与用于预测风速区间的所述改进随机敏感度作为三个优化目标,使用多目标遗传优化算法NSGA-III进行多目标优化,得到帕累托最优种群;其中所述NSGA-III优化的是所述神经网络模型训练模块中得到的初始解参数,所述初始解参数的范围在[-1,1],目的是使问题更容易收敛并且对不同问题具有泛化性,最后,再从所述帕累托最优种群中得到最优解。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110294165.4A CN113191526B (zh) | 2021-03-19 | 2021-03-19 | 基于随机敏感度的短期风速区间的优化预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110294165.4A CN113191526B (zh) | 2021-03-19 | 2021-03-19 | 基于随机敏感度的短期风速区间的优化预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113191526A CN113191526A (zh) | 2021-07-30 |
CN113191526B true CN113191526B (zh) | 2023-05-09 |
Family
ID=76973476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110294165.4A Active CN113191526B (zh) | 2021-03-19 | 2021-03-19 | 基于随机敏感度的短期风速区间的优化预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113191526B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113516320B (zh) * | 2021-09-14 | 2021-12-10 | 国能日新科技股份有限公司 | 基于多目标遗传算法风速订正和预测风速优化方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101706335A (zh) * | 2009-11-11 | 2010-05-12 | 华南理工大学 | 一种基于遗传算法优化bp神经网络的风电功率预测方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239964B (zh) * | 2014-08-18 | 2017-10-10 | 华北电力大学 | 基于谱聚类和遗传优化极端学习机的超短期风速预测方法 |
US10410121B2 (en) * | 2017-10-25 | 2019-09-10 | SparkCognition, Inc. | Adjusting automated neural network generation based on evaluation of candidate neural networks |
CN108022025B (zh) * | 2017-12-28 | 2020-08-18 | 华中科技大学 | 一种基于人工神经网络的风速区间预测方法与系统 |
CN108345904A (zh) * | 2018-01-26 | 2018-07-31 | 华南理工大学 | 一种基于随机敏感度采样的不平衡数据的集成学习算法 |
-
2021
- 2021-03-19 CN CN202110294165.4A patent/CN113191526B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101706335A (zh) * | 2009-11-11 | 2010-05-12 | 华南理工大学 | 一种基于遗传算法优化bp神经网络的风电功率预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113191526A (zh) | 2021-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sun et al. | Short-term wind power forecasts by a synthetical similar time series data mining method | |
Kumari et al. | Extreme gradient boosting and deep neural network based ensemble learning approach to forecast hourly solar irradiance | |
Jebli et al. | Prediction of solar energy guided by pearson correlation using machine learning | |
Liu et al. | Random forest solar power forecast based on classification optimization | |
CN113962364B (zh) | 一种基于深度学习的多因素用电负荷预测方法 | |
Qazi et al. | The artificial neural network for solar radiation prediction and designing solar systems: a systematic literature review | |
Abuella et al. | Solar power forecasting using artificial neural networks | |
Lipu et al. | Artificial intelligence based hybrid forecasting approaches for wind power generation: Progress, challenges and prospects | |
Farah et al. | Short-term multi-hour ahead country-wide wind power prediction for Germany using gated recurrent unit deep learning | |
JP5888640B2 (ja) | 太陽光発電予測装置、太陽光発電予測方法及び太陽光発電予測プログラム | |
Rafati et al. | High dimensional very short-term solar power forecasting based on a data-driven heuristic method | |
Junior et al. | Optimized hybrid ensemble learning approaches applied to very short-term load forecasting | |
CN112100911B (zh) | 一种基于深度bilstm的太阳辐射预测方法 | |
CN115860177A (zh) | 基于组合式机器学习模型光伏发电功率预测方法及其应用 | |
Bou-Rabee et al. | One-month-ahead wind speed forecasting using hybrid AI model for coastal locations | |
CN116526473A (zh) | 基于粒子群优化lstm的电热负荷预测方法 | |
CN114676923A (zh) | 发电功率的预测方法、装置、计算机设备和存储介质 | |
CN115115125A (zh) | 基于深度学习融合模型的光伏功率区间概率预测方法 | |
CN113191526B (zh) | 基于随机敏感度的短期风速区间的优化预测方法及系统 | |
Qureshi et al. | Short-term forecasting of wind power generation using artificial intelligence | |
Ramakrishna et al. | A Stochastic Model for Short-Term Probabilistic Forecast of Solar Photo-Voltaic Power | |
Bellagarda et al. | Effectiveness of neural networks and transfer learning to forecast photovoltaic power production | |
CN113111592A (zh) | 一种基于emd-lstm的短期风电功率预测方法 | |
Yuan et al. | Short-term wind speed forecasting using STLSSVM hybrid model | |
Zhang et al. | Inferential statistics and machine learning models for short-term wind power forecasting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |