CN117096871A - 一种基于时空分布的风电功率概率密度的预测方法 - Google Patents

一种基于时空分布的风电功率概率密度的预测方法 Download PDF

Info

Publication number
CN117096871A
CN117096871A CN202311098724.XA CN202311098724A CN117096871A CN 117096871 A CN117096871 A CN 117096871A CN 202311098724 A CN202311098724 A CN 202311098724A CN 117096871 A CN117096871 A CN 117096871A
Authority
CN
China
Prior art keywords
wind power
prediction
layer
node
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311098724.XA
Other languages
English (en)
Inventor
彭曙蓉
彭家宜
郭丽娟
陈慧霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changsha University of Science and Technology
Original Assignee
Changsha University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changsha University of Science and Technology filed Critical Changsha University of Science and Technology
Priority to CN202311098724.XA priority Critical patent/CN117096871A/zh
Publication of CN117096871A publication Critical patent/CN117096871A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/004Generation forecast, e.g. methods or systems for forecasting future energy generation
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/38Arrangements for parallely feeding a single network by two or more generators, converters or transformers
    • H02J3/381Dispersed generators
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2300/00Systems for supplying or distributing electric power characterised by decentralized, dispersed, or local generation
    • H02J2300/20The dispersed energy generation being of renewable origin
    • H02J2300/28The renewable source being wind energy

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Optimization (AREA)
  • Economics (AREA)
  • Power Engineering (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Public Health (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Water Supply & Treatment (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Algebra (AREA)

Abstract

本发明公开了一种基于时空分布的风电功率概率密度的预测方法;包括以下步骤:S1、对风机数据进行预处理:对异常值进行检测并对其进行修复,然后对数据进行归一化处理;S2、基于欧式距离和差分距离两个指标共同提取单个风机的临近节点数,基于图注意力机制对风机数据进行信息聚合,构建输入矩阵特征;S3、构建不同隐含层的风电功率概率密度的预测模型;S4、将获得的风电功率输入矩阵特征作为输入传送给不同隐含层的预测模型来训练及预测,输出预测风电功率曲线。本发明基于图注意力机制的模型预测能够提升对风电功率的预测精度,解决现有时不变模型存在的预测精度低,无法准确预测风电功率的不确定性的问题。

Description

一种基于时空分布的风电功率概率密度的预测方法
技术领域
本发明涉及风电功率预测技术领域,特别是涉及一种基于时空分布的风电功率概率密度的预测方法。
背景技术
风电功率预测技术是指对未来一段时间内风电场所能输出的功率大小进行预测,以便安排调度计划。这是因为风能属于随机波动的不稳定能源,大规模的风电并入系统,必将会对电力系统的稳定性带来新的挑战。因此,准确预测风电功率,对电力调度策略的制定以及电力系统的稳定运行具有重大意义。
现有的风电功率预测方法包括确定性预测(点预测)和不确定性预测(区间预测),点预测方法能够得到一个确定的风电功率预测值,主要涉及支持向量机、时间序列、神经网络等,但其不能对风电功率的不确定性做出定量描述。由于风力发电十分依赖自然因素,并且容易受天气因素的影响,具有不确定性,因此,传统的点预测方法无法避免预测误差。而不确定性预测是对未来时刻的风电功率波动范围或概率密度的预测,可以反映具体时刻风电功率波动范围及其概率,其预测结果一般是以风电功率概率密度函数的形式呈现。与点预测方法相比,不确定性预测能够量化风电功率的不确定性,能够对风电功率进行更加准确的预测,为电力系统调度人员带来更加全面的决策依据。目前,传统的不确定预测是针对整个风电场范围内的所有风机出力总和进行的,主要是以时间序列预测为主,没有考虑不同位置风机的差异性,此外不确定性预测多采用基于RNN或CNN模型预测方法,而RNN或CNN模型及其变体都具有时不变性质,即模型参数随着时间的推移保持不变,持续使用相同的权重参数,基于风电功率的不确定性,这些模型的时不变性质会降低其对风电功率的预测能力,预测精度较低,无法准确预测风电功率的不确定性。
发明内容
本发明实施例的目的在于提供一种基于时空分布的风电功率概率密度的预测方法,以实现风电场内单风机风电功率的高精度预测,解决现有技术无法准确预测风电功率的不确定性的问题。
为解决上述技术问题,本发明所采用的技术方案是,一种基于时空分布的风电功率概率密度的预测方法,包括以下步骤:
S1、对风机数据进行预处理:对异常值进行检测并对其进行修复,然后对数据进行归一化处理;
S2、基于欧式距离和差分距离两个指标共同提取单个风机的临近节点数,基于图注意力机制对风机数据进行信息聚合,构建输入矩阵特征;
S3、构建不同隐含层的风电功率概率密度的预测模型;
S4、将获得的风电功率输入矩阵特征作为输入传送给不同隐含层的风电功率概率密度的预测模型来训练及预测,输出预测风电功率曲线。
进一步的,S1中风机数据包括风速、风向、温度、叶片俯仰角、风电机机舱的偏航角。
进一步的,所述S1具体为:
根据下式计算异常分数:
式中,S(x)为样本x的异常值分数,其取值范围为[0,1];h(x)为样本在树上的路径长度,h(x)=ln(x)+ξ,ξ为欧拉常数;E(h(x))为样本x在树上的路径长度均值;c(x)为一个包含x个样本的数据集构成的二叉树的平均搜索路径长度,其中,
其中h(·)为调和数;使用拉格朗日插值法对异常值进行修复:
其中,xi、xj为表示节点i、j的风速;yi为风电功率;L()为拉格朗日插值多项式;同时对风电功率数据进行归一化处理,消除量纲影响,将每一风电功率数据转化为[0,1]之间的风电功率数据:
其中,xw′为风电功率的归一化值,max(xw)为风电功率数据最大值,min(xw)为风电功率数据最小值,xw为风电功率实际值。
进一步的,所述S2中,提取单个风机的临近节点数的过程具体为:
欧氏距离相关性:计算某个风机节点与其他节点间的欧式距离:
其中,(xa,ya)与(xb,yb)为风机a、b的二维空间位置;
选择距离最接近的K个节点作为该风机节点的临近节点,如下式所示:
式中,A(i,j)为欧式距离相关性得到的风机临近节点矩阵;N(i)为欧氏距离最接近的K个的风机节点集合;
差分距离相关性:捕获风机之间的隐式关系,通过计算两个节点间的差分相似度Sim(i,j),将最近的K个节点作为差分临近节点,表示为集合Ns(i),其中:
t为总的时间序列T内的某个时刻,w代表风速,xi,w∈RT×1表示第i个节点的风力涡轮机的风速序列,xj,w∈RT×1表示第j个节点的风力涡轮机的风速序列。
进一步的,所述S2中,基于图注意力机制对风机数据进行信息聚合过程具体为:
S201、计算各数据特征向量在中心目标节点与邻居节点注意力分数,节点j的特征对节点i上的注意力值为eij
S202、使用激活函数激活权重分数得到ei,j
ei,j=LeakyReLU(aT[Whi||Whj])
S203、权重归一化,后续为了信息聚合需要所有权重之和为1,使用softmax对节点的所有邻接节点注意力值进行权重归一化操作,归一化后的值为αij
S204、通过图注意力层将节点自身特征信息和邻居节点特征信息按照一定的权重系数进行相加求和,进行特征提取形成新的节点来表示特征,输出结果为新的节点特征:
S205、多头注意力机制将多个节点的输出结果进行列向量拼接,得到最后的新节点特征,新节点特征的计算公式:
其中,eij为中心目标节点与邻居节点注意力分数,即节点i的特征对节点j上的注意力值;α代表节点间的相关度计算函数;hi为i节点的输出向量;W为权重,由模型训练得到,用于将原始节点的特征映射到一个新的维度;ei,j为激活函数激活的权重分数,其中||为向量竖向拼接操作,将映射后的列向量进行拼接;Leaky ReLU为激活函数;α为待学习的向量,aT为向量α的转置;h‘i为新节点特征;σ(·)为激活函数;αij为节点i特征在节点j上的注意力分数,eik表示邻居节点;代表第k个注意力机制计算得到的注意力分数归一化值;Wk为线性变换的权重矩阵,K表示为k的集合。
进一步的,S3中所述风电功率概率密度的预测模型包括多层神经网络,每一层神经网络包括依次连接的输入层、隐含层和输出层。
进一步的,所述隐含层为如下形式的前馈形网络的一种:
a.隐含层为MLP多层感知器,风电功率概率密度预测模型隐含层采用MLP结构,其中dense为全连接层,MLP网络的隐含层和输出层都是全连接层,每一层都具有24个ReLU神经元单元,其中的神经元节点完全连接;
b.隐含层为CNN,其结构包括卷积层、池化层和全连接层,其中卷积层由24个ReLU神经元构成;
c.隐含层为基于注意力机制的全连接层,在全连接层的基础上增加了注意力机制的模块。
进一步的,S4具体为:选择出力最高且时空关联性较高的N个风力涡轮机的数据作为训练模型的历史数据,使用这些数据进行预测作为其他涡轮机的输出,并将预测结果的平均值作为风电厂的其他涡轮机的预测结果;
其中,所述N值的确定方法为:通过在模型中采用线性输出的方法得到不同N值的预测结果,选取误差指标最小的N值作为最后结果。
进一步的,所述预测包括确定性预测、多部预测及不确定性预测;
其中,多部预测为每一步预测未来12个时间点的数据,在下一个时刻预测前把上一步得到的预测结果与历史特征合并,共同作为下一个模型的输入;
确定性预测:在模型输出层采用线性输出的方式并通过多步预测得到确定性的预测结果;
不确定性预测:在模型输出层采用高斯混合密度网络进行概率密度输出得到风电功率的区间预测结果;根据区间覆盖率CP和区间平均宽度NWP指标评判模型优劣,并根据根据不同的隐含层模型对模型进行改进。
进一步的,所述区间覆盖率CP和区间平均宽度NWP分别为:
其中,c为测试集中真实值落在预测区间内的数目;v为测试集中真实值总数目;Ymax是预测时刻t测试集风电功率最大值,Ymin为预测时刻t测试集风电功率最小值;Ut为预测区间上界;Lt为预测区间下界。
与现有技术相比,本发明的有益效果是:
(1)基于图注意力网络和相关距离函数对风电数据输入进行信息聚合能够在一定程度上改善预测模型对时空数据的提取能力。
(2)ForecastNet模型时不变特性和交错输出特性,在进行多步预测过程中可以有效地解决神经网络模型传递的梯度爆炸或消失的问题,训练速度更快。
(3)使用高出力风机数据作为训练模型,基于训练好的模型对其他风力涡轮机进行预测用以代表其他涡轮机的输出,取最高出力的N个风机数据进行训练,将得到的预测结果取组合加权作为预测结果矫正,简化了预测流程。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是为本发明的预测模型结构图;
图2是异常数据进行检测的风速-功率曲线图;
图3是图注意力机制处理特征信息示意图;
图4是本发明的多层前馈神经网络结构图;
图5是本发明的ForecastNet模型交错输出特性图;
图6是本发明的隐含层为MLP多层感知器的ForecastNet模型(CNNFN)图;
图7是本发明的隐含层为CNN的ForecastNet模型(ADFN)图;
图8是本发明的隐含层为基于注意力机制的全连接层的ForecastNet模型(ADFN)图;
图9是本发明的多步预测示意图;
图10是本发明的基于时空分布的ForecastNet的风电功率预测框架图;
图11是本发明的不同top风机数量的多步预测误差曲线图;
图12是本发明的不同ForecastNet模型的风电功率预测区间对比图;
图13是本发明的风机#1不同模型的区间预测结果对比图;
图14是本发明的风机#96不同模型的区间预测结果对比图;
图15是本发明的风机#128不同模型的区间预测结果对比图;
图16是本发明的风机#128不同模型的区间预测结果对比图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明基于时空分布的风电功率概率密度的预测方法包括以下三个部分:
一、如图1,基于风电功率相关的影响因素进行数据处理,挖掘特征相关性的同时提升数据质量。
在数据方面:风电功率的主要影响因素有风速、风向、温度、叶片俯仰角、机舱的偏航角等,提取各时间窗下风电功率相关的影响因素趋势特征,并对风电功率数据使用孤立森林算法对异常值进行检测,用拉格朗日插值法对其进行修复,提高数据质量。数据集中存在的异常数据,异常数据包括了缺失数据、未知数据和其他奇异点,如果不进行对应处理,这些异常数据对于模型训练和预测精度造成影响。若在以风速为x轴,发电量为y轴的散点图上绘制数据,其数据分布大致为s型。偏离s型分布太大的数据被认为是异常,数据挖掘算法可以根据这种分布检测出异常,使用孤立森林算法来识别这些异常值。孤立森林算法可以快速的将数据中的异常值和空缺值与正常数据分离,通过对数据路径的长度来对数据的异常程度进行打分判断,分数越高数据的异常程度越高,通过设定一定的异常数据比例,算法可以快速区分异常数据和正常数据,孤立森林算法的异常分数计算式:
式中,S(x)为样本x的异常值分数,其取值范围为[0,1],该值越大,样本越有可能被标记为异常;h(x)为样本在树上的路径长度(pathlength),h(x)=ln(x)+ξ,ξ为欧拉常数;E(h(x))为样本x在树上的路径长度均值;c(x)为一个包含x个样本的数据集构成的二叉树的平均搜索路径长度,其中,
h(·)为调和数。
孤立森林算法通过划分数据随机选取特征值,更容易挑出分布稀疏的离群值。无论是缺失数据还是异常数据,对模型的预测精度影响较大,本发明将采用拉格朗日插值法针对孤立森林检测的异常数据进行修复:
其中,xj对应自变量的位置,这里是指风速;yj对应自变量位置的函数值,这里对于风电功率。图2展示了对异常数据进行检测的风速-功率曲线图,包括了异常检测结果以及由插值法进行修复的结果,其中橙色圆点表示异常数据和修复数据,蓝色圆点表示正常数据。
同时对风电功率数据进行归一化处理,消除量纲影响,采用最大最小标准化法对补充处理后的风电功率数据进行归一化处理,将每一风电功率数据转化为[0,1]之间的风电功率数据:
其中,xw′为风电功率的归一化值,max(xw)为风电功率数据最大值,min(xw)为风电功率数据最小值,xw为风电功率实际值。
在特征处理方面:基于欧式距离和差分距离两个指标共同提取单个风机的临近节点,由于环境信息也可以在短距离内发生比较大的变化,如两个风机一个在迎风坡一个在背风坡,在这种情况下,它们可以接收的风向是可以完全相反的,但是它们之间的相对距离比较小。因此仅凭借欧式距离并不能充分体现不同位置风力发电机间的处理相关性,在此基础上引入了一个差分距离来捕获风机间的相邻关系;基于图注意力机制对风机数据进行信息聚合,构建输入矩阵特征;
其中,欧氏距离相关性:计算某个风机节点与其他节点间的欧式距离,选择距离最接近的K个节点作为该风机节点的临近节点,如下式所示:
式中,A(i,j)为欧式距离相关性得到的风机临近节点矩阵;N(i)为欧氏距离最接近的K个的风机节点集合。
差分距离相关性:捕获风机之间的隐式关系,通过计算两个节点间的差分相似度Sim(i,j),将最近的K个节点作为差分临近节点,表示为集合Ns(i):
t为总的时间序列T内的某个时刻,w代表风速(windspeed),xi,w∈RT×1表示第i个风力涡轮机的风速序列,xj,w∈RT×1表示第j个风力涡轮机的风速序列。
使用图注意力网络机制从大量信息中选择一些关键信息进行处理,以简化运算,减少模型的运算负担。图注意力网络处理信息的方式是对信息进行权重计算并按照一定的权重对信息进行加权,将信息进行聚合,具体的通过查询向量(Query)、键值向量(Key)、值向量(Value)来计算信息的注意力分数,计算公式如下:
其中Q是查询向量序列、K是键向量序列、V是值向量序列,L为输入特征长度。
针对风电功率数据的图注意力机制的运算步骤具体如下:
1)计算各数据特征向量在中心目标节点与邻居节点注意力分数,节点j的特征对节点i上的注意力值为eij
eij=a(Whi,Whj)
2)使用激活函数激活权重分数得到ei,j
ei,j=LeakyReLU(aT[Whi||Whj])
3)权重归一化,后续为了信息聚合需要所有权重之和为1,使用softmax对节点i的所有邻接节点注意力值进行权重归一化操作,归一化后的值为αij
4)通过图注意力层将节点自身特征信息和邻居节点特征信息按照一定的权重系数进行相加求和,进行特征提取形成新的节点来表示特征,输出结果为新的节点特征:
5)多头注意力机制将多个节点的输出结果进行列向量拼接,得到最后的新节点特征,新节点特征的计算公式:
其中,eij为中心目标节点与邻居节点注意力分数,即节点i的特征对节点j上的注意力值;α代表节点间的相关度计算函数,一般的计算方式是内积操作;hj为i节点的输出向量;W为权重,由模型训练得到,用于将原始节点的特征映射到一个新的维度;ei,j为激活函数激活的权重分数,其中||为向量竖向拼接操作,将映射后的列向量进行拼接;Leaky ReLU为激活函数;α为待学习的向量,aT为向量α的转置;ai,j为归一化的节点注意力值权重;h‘i为新节点特征;σ(·)为激活函数;αij为节点i特征在节点j上的注意力分数;代表第k个注意力机制计算得到的注意力分数归一化值;Wk为线性变换的权重矩阵。
如图3,在空间信息使用图注意力机制对特征信息进行处理,结合多头注意力机制,为目标节点与其临近节点计算不同的注意力分数权重,有利于提升模型对空间维度的表达能力并降低过拟合风险。图注意力层的输入为一组节点向量特征矩阵h={h1,h2,...,hN},其中N为节点数量;图注意力层的输出为一组信息聚合后的新节点特征,其维度可能不同。多头注意力机制得到的新节点维度与原本节点的维度也存在不同,例如原本节点的维度为3,计算得到的W为[5,3],则每个注意力机制的输出维度为5,将8组数据进行列向拼接得到的新节点维度为40。
经过信息聚合得到的模型输入特征矩阵h'={h1',h2',...,hN'},不仅包含了自身风机节点的特征信息,还包含了临近风机的节点信息,有助于模型捕捉风机数据序列在时空上的关联性。
二、建立基于时空分布的ForecastNet预测模型
由于传统RNN均采用tanh和sigmoid作为激活函数,存在RNN在反向传播时产生梯度爆炸或消失的现象,因此采用了ForecastNet模型依据其时不变的特性,如图4和图5所示,可以有效地解决神经网络传递过程的梯度爆炸或消失的问题。
如图6-8所示,建立不同的隐含层的ForecastNet预测模型,采用多步预测:
首先是建立模型,ForecastNet的输入层是单变量或者多变量输入集合;本发明时变深度前馈神经网络预测模型包括多层神经网络,每一层神经网络包括依次连接的输入层、隐含层和输出层,隐含层为不同形式的前馈神经网络,如常见的BP网络、RBF网络等。每个隐含层的架构可以是异构的,也可以是相同的,每一个隐含层的参数相互独立,用于模拟时间序列的动态特性,在隐含层采用不同的前馈网络以得到ForecastNet模型的不同变体,进而得到不同预测性能的预测模型。
d.隐含层为MLP多层感知器的ForecastNet模型(MLPFN),ForecastNet隐含层采用MLP结构,如图4所示,其中dense为全连接层,h代表每一层隐含层的神经元节点的数量,MLP网络的隐含层和输出层都是全连接层,每一层都具有24个ReLU神经元单元,其中的神经元节点完全连接。
e.隐含层为CNN的ForecastNet模型(CNNFN),CNN是人工神经网络的一种,其结构主要由3部分组成,分别是卷积层(Convolution Layer)、池化层(Max Pooling Layer)和全连接层(Dense),如图5所示,其中卷积层的主要在作用是提取特征,f为卷积核数量,k代表的是卷积核的大小,池化层用于下采样,s代表池化层的填充,p代表池化层的步幅,全连接主要用于特征分类,h为全连接层的隐含层数量,由24个ReLU神经元构成。
f.隐含层为基于注意力机制的全连接层的ForecastNet模型(ADFN),在全连接层的基础上增加了注意力机制的模块。
其次是预测优化。每个风力涡轮机的出力存在一定的差异,针对每一台风机去建立模型工作量不仅较大,而且模型训练过程繁琐复杂,因此根据平均风力功率假设进行预测:具体地,风力涡轮机的平均风电功率(Patv)数据越高,表明风机出力越接近理论输出,选择出力最高且时空关联性较高的N个风力涡轮机的数据作为训练模型的历史数据,并使用这些数据进行预测作为其他涡轮机的输出,并将预测结果的平均值作为风电厂的其他涡轮机的预测结果;N值的确定:通过在ForecastNet模型中采用线性输出的方法得到不同N值的预测结果,选取误差指标最小的N值作为最后结果。
多步预测:每一步预测未来12个时间点的数据,在下一个时刻预测前把上一步得到的预测结果与历史特征合并,共同作为下一个模型的输入,可以更加精准的学习风电功率随时间的变化趋势的同时还充分考虑了风电数据在输入与输出之间和不同时刻输出之间的关联性。
确定性预测:在ForecastNet模型输出层采用线性输出的方式并通过多步预测可以得到确定性的预测结果,通过确定性预测结果得到的误差评价指标可以帮助判断2)中N的最佳取值。
不确定性预测:在ForecastNet模型输出层采用高斯混合密度网络进行概率密度输出得到风电功率的区间预测结果。根据不同的隐含层模型对模型进行改进,根据区间覆盖率和区间平均宽度指标评判模型优劣。ForecastNet模型中的每一个输出都提供了对未来的一个预测,模型网络越深,输出的信息就越多,随着预测范围的扩大,模型网络会变得愈加复杂。使用混合密度网络的思想,每个输出均建立一个概率分布模型,采用正态分布模型。第l层输出的正态分布的均值和标准差如下:
其中a[l-1]为上一个隐藏单元的输出,和/>为均值层的权重和偏置,/>为标准差层的权重和偏置。
然后对模型进行验证。区间覆盖率是一个用来衡量区间预测准确性的指标,表示预测区间内包含真实值的比例。覆盖率越高说明预测越准确,即预测区间内的实际值越多,预测效果越好。在给定的置信度下,预测区间的覆盖率不能低于置信度的要求,否则预测结果不可靠。在风电功率预测中,区间覆盖率是评估预测精度的重要指标之一,但是仅凭借区间覆盖率不足以评判区间预测的好坏,还需要区间宽度指标,区间平均宽度指标描述的是预测区间的平均宽度,通常用于评估区间预测的精度和有效性。当区间覆盖率越高时,区间平均宽度应当越小,这表明模型在预测过程中能够提供更为精确的区间范围,相对而言,区间覆盖率较高但区间平均宽度过大的模型预测结果则可能存在一定程度的缺陷,区间覆盖率CP和区间平均宽度NWP分别为:
其中,c为测试集中真实值落在预测区间内的数目;v为测试集中真实值总数目;Ymax是预测时刻t测试集风电功率最大值,Ymin是预测时刻t测试集风电功率最小值;Ut为预测区间上界;Lt为预测区间下界。
三、进行预测确定性预测与不确定性预测
S1、在ForecastNet的输出层采用线性输出可以得到确定性的预测值,除了可以得到确切的预测功率输出值还可以确定最佳的N值。针对单个风机对其进行时间序列预测,其中输入数据特征包括了信息聚合得到的新矩阵,包括了风速、环境温度、无功功率等,训练风电功率预测模型,预测得到未来144个时间点内的风电功率出力曲线,具体步骤如下:将数据集分成训练集和测试集;对数据进行归一化处理;创建滑动窗口数据集,以形成输入和输出序列;转化数据结构以便输入模型中进行训练;构建并训练模型,用模型对测试集进行预测,使用模型对未来144个时间点进行预测,并进行反归一化处理,以便于绘制预测曲线。训练风电功率预测模型,预测得到未来144个时间点内的风电功率出力曲线,参数具体如下表1:
表1预测模型参数
参数名称 参数值
in_seq_length 128
out_seq_length 12
hidden_dim 32
input_dim 1
output_dim 1
learning_rate 0.0001
n_epochs 100
batch_size 64
model_type dense2/conv2
S2、在ForecastNet模型输出层采用高斯混合密度网络进行概率密度输出得到风电功率的区间预测结果,根据不同的隐含层模型对模型进行改进,根据区间覆盖率CP和区间平均宽度NWP指标评判模型优劣。
S3、进行ForecastNet不确定性模型预测结果判定:不确定预测的评判需要预测结果在区间覆盖率达到置信度的情况下取得更窄的区间预测宽度,才能够更好的拟合风电功率的变化趋势,此外在多步预测中预测模型在不同的时间预测点的概率密度函数曲线需要表面完整平滑,没有出现缺失、极高、极低或者曲线过于宽泛和过于狭窄的情况,在测试集得到的概率密度曲线结果中,大部分实际值都靠近曲线中心范围,只有少部分实际值偏离较远,这种情况下得到的预测结果是可靠的。
实施例
以某风电站的监控和数据采集(SCADA)系统采集得到的数据为数据集,SCADA数据每10分钟从风力发电场中的每个风力涡轮机采样一次,该风电站2022年1月1日-2022年6月26日245天的数据和发电量为例,以验证本文方法的有效性。图9为多步预测方法图,在每一次的多步预测中,每一步预测未来12个时间点的数据,在下一个时刻预测前把上一步得到的预测结果与历史特征合并,共同作为下一个模型的输入,可以更加精准的学习风电功率随时间的变化趋势的同时还充分考虑了风电数据在输入与输出之间和不同时刻输出之间的关联性。
将历史数据经过处理输入到ForecastNet预测模型,经过多步预测从而得到相应的预测值。图10为总体预测方法图,其中不同预测步长以及不同最高出力风机数量的确定性预测结果误差如图11所示,ForecastNet在对邻近风机进行预测时得到了相似的误差分布,说明ForecastNet模型在处理临近风机做到了相对应的特征聚合,得到了相似的误差输出,而且短期预测内误差RMSE控制在60以下,其预测趋势较为良好稳定,但是在200次预测后出现了较大的误差波动,随后误差波动趋于较为稳定,原因可能是风速等特征在这次预测时出现了比较大的波动,总体上大部分预测步的误差表现较为良好,由上述图和表的数据可知,在选择top-4的风机进行预测可以取得较好的预测效果。
图12为在不同的置信度下(80%、85%、90%)随机选取多步预测过程中不同的预测步的预测结果的预测区间,在不同的置信度下,预测区间覆盖率最高的是CNNFN模型,但是过高的区间覆盖率可能会导致敏锐性指标的上升,其区间平均宽度也是三种模型中最高的,在区间覆盖率确定的情况下区间平均宽度越宽,区间预测的实际意义越小。ADFN模型和MPLFN模型均得到了比较好的预测效果,预测得到的区间覆盖率均达到了事先指定的置信度,在置信度90%、85%、80%的情况下,MLPFN模型的区间覆盖率高于ADFN模型,而ADFN的区间平均宽度更窄,取得了更好的预测效果。综合上述分析可以得出ADFN模型和MLPFN模型的预测效果要优于CNNFN模型,ADFN模型基于注意力机制在区间覆盖率达到置信度的情况下取得了更窄的区间预测宽度,能够更好的拟合风电功率的变化趋势,而CNNFN模型在较高置信度的情况下得到了100%的区间覆盖率,使得预测区间的实际意义较小。
图13-15为在90%置信度下三种不同风机ANFN模型与其他常见模型LSTM(长短期记忆网络和高斯混合密度模型的组合)和QRGBM模型(梯度提升机采用分位数输出)的对比,预测结果中QRGBM得到了区间覆盖率最高,但是其区间宽度较其他模型更宽泛,过于宽泛的区间宽度将导致预测结果中可利用的有效信息越少;LSTM和ANFN模型的区间覆盖率相近,在图13下ANFN模型得到的区间平均宽度更窄一些,在其他风机下却更宽,其区间平均宽度相比LSTM模型更宽,ANFN基于注意力机制,区间覆盖率小幅度增加的情况下,也增加了一定的区间平均宽度,预测效果较好;而在如图13-15中三种模型的区间覆盖率都没达到置信度,预测效果不佳。
图16为从多步预测中随机选取了ANFN预测模型在不同风力涡轮机和不同的时间预测点的概率密度函数曲线,图中垂直于x坐标轴的直线为该预测时刻的真实值,曲线为对应模型的概率密度分布,概率密度函数能反应风电功率的波动的不确定性,由图可知概率密度曲线表面完整平滑,没有出现缺失、极高、极低或者曲线过于宽泛和过于狭窄的情况,表明算法的预测效果是合适的,ANFN模型的预测结果中大部分真实值落在了概率密度曲线的最高概率点附近,如t=167、t=110、t=100和t=0时,这表明该算法预测的准确度较高,实际的风电功率值处于概率密度曲线的波峰附近时,表明风电功率真实值落在了区间预测给出的高概率区间中,其预测趋势与实际的风电功率值基本上保持一致,这些时刻的预测预测误差较小。当t=20时,风电功率实际值偏离概率曲线的中心,而t=30时,偏离的距离更远了,这说明这些时刻的预测误差很大,预测区间甚至可能没有覆盖住风电功率的实际值,但是在测试集得到的概率密度曲线结果中,如果大部分实际值都靠近曲线中心范围,只有少部分实际值偏离较远的情况下,预测结果是可靠的;若大部分实际值偏离甚至远离概率密度曲线波峰位置,则得到的概率密度预测结果不可靠。综上ANFN预测模型在对不同风机进行概率密度预测时得到的预测结果是可靠的。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种基于时空分布的风电功率概率密度的预测方法,其特征在于,包括以下步骤:
S1、对风机数据进行预处理:对异常值进行检测并对其进行修复,然后对数据进行归一化处理;
S2、基于欧式距离和差分距离两个指标共同提取单个风机的临近节点数,基于图注意力机制对风机数据进行信息聚合,构建输入矩阵特征;
S3、构建不同隐含层的风电功率概率密度的预测模型;
S4、将获得的风电功率输入矩阵特征作为输入传送给不同隐含层的风电功率概率密度的预测模型来训练及预测,输出预测风电功率曲线。
2.根据权利要求1所述的一种基于时空分布的风电功率概率密度的预测方法,其特征在于,S1中风机数据包括风速、风向、温度、叶片俯仰角、风电机机舱的偏航角。
3.根据权利要求1所述的一种基于时空分布的风电功率概率密度的预测方法,其特征在于,所述S1具体为:
根据下式计算异常分数:
式中,S(x)为样本x的异常值分数,其取值范围为[0,1];h(x)为样本在树上的路径长度,h(x)=ln(x)+ξ,ξ为欧拉常数;E(h(x))为样本x在树上的路径长度均值;c(x)为一个包含x个样本的数据集构成的二叉树的平均搜索路径长度,其中,
其中h(·)为调和数;使用拉格朗日插值法对异常值进行修复:
其中,xi、xj为表示节点i、j的风速;yi为风电功率;L()为拉格朗日插值多项式;同时对风电功率数据进行归一化处理,消除量纲影响,将每一风电功率数据转化为[0,1]之间的风电功率数据:
其中,xw′为风电功率的归一化值,max(xw)为风电功率数据最大值,min(xw)为风电功率数据最小值,xw为风电功率实际值。
4.根据权利要求1所述的一种基于时空分布的风电功率概率密度的预测方法,其特征在于,所述S2中,提取单个风机的临近节点数的过程具体为:
欧氏距离相关性:计算某个风机节点与其他节点间的欧式距离:
其中,(xa,ya)与(xb,yb)为风机a、b的二维空间位置;
选择距离最接近的K个节点作为该风机节点的临近节点,如下式所示:
式中,A(i,j)为欧式距离相关性得到的风机临近节点矩阵;N(i)为欧氏距离最接近的K个的风机节点集合;
差分距离相关性:捕获风机之间的隐式关系,通过计算两个节点间的差分相似度Sim(i,j),将最近的K个节点作为差分临近节点,表示为集合Ns(i),其中:
t为总的时间序列T内的某个时刻,w代表风速,xi,w∈RT×1表示第i个节点的风力涡轮机的风速序列,xj,w∈RT×1表示第j个节点的风力涡轮机的风速序列。
5.根据权利要求1所述的一种基于时空分布的风电功率概率密度的预测方法,其特征在于,所述S2中,基于图注意力机制对风机数据进行信息聚合过程具体为:
S201、计算各数据特征向量在中心目标节点与邻居节点注意力分数,节点j的特征对节点i上的注意力值为eij
eij=a(Whi,Whj)
S202、使用激活函数激活权重分数得到ei,j
ei,j=LeakyReLU(aT[Whi||Whj])
S203、权重归一化,后续为了信息聚合需要所有权重之和为1,使用softmax对节点的所有邻接节点注意力值进行权重归一化操作,归一化后的值为αij
S204、通过图注意力层将节点自身特征信息和邻居节点特征信息按照一定的权重系数进行相加求和,进行特征提取形成新的节点来表示特征,输出结果为新的节点特征:
S205、多头注意力机制将多个节点的输出结果进行列向量拼接,得到最后的新节点特征,新节点特征的计算公式:
其中,eij为中心目标节点与邻居节点注意力分数,即节点i的特征对节点j上的注意力值;α代表节点间的相关度计算函数;hi为i节点的输出向量;W为权重,由模型训练得到,用于将原始节点的特征映射到一个新的维度;ei,j为激活函数激活的权重分数,其中||为向量竖向拼接操作,将映射后的列向量进行拼接;Leaky ReLU为激活函数;α为待学习的向量,aT为向量α的转置;h‘i为新节点特征;σ(·)为激活函数;αij为节点i特征在节点j上的注意力分数,eik表示邻居节点;代表第k个注意力机制计算得到的注意力分数归一化值;Wk为线性变换的权重矩阵,K表示为k的集合。
6.根据权利要求1所述的一种基于时空分布的风电功率概率密度的预测方法,其特征在于,S3中所述风电功率概率密度的预测模型包括多层神经网络,每一层神经网络包括依次连接的输入层、隐含层和输出层。
7.根据权利要求6所述的一种基于时空分布的风电功率概率密度的预测方法,其特征在于,所述隐含层为如下形式的前馈形网络的一种:
a.隐含层为MLP多层感知器,风电功率概率密度预测模型隐含层采用MLP结构,其中dense为全连接层,MLP网络的隐含层和输出层都是全连接层,每一层都具有24个ReLU神经元单元,其中的神经元节点完全连接;
b.隐含层为CNN,其结构包括卷积层、池化层和全连接层,其中卷积层由24个ReLU神经元构成;
c.隐含层为基于注意力机制的全连接层,在全连接层的基础上增加了注意力机制的模块。
8.根据权利要求1所述的一种基于时空分布的风电功率概率密度的预测方法,其特征在于,S4具体为:选择出力最高且时空关联性较高的N个风力涡轮机的数据作为训练模型的历史数据,使用这些数据进行预测作为其他涡轮机的输出,并将预测结果的平均值作为风电厂的其他涡轮机的预测结果;
其中,所述N值的确定方法为:通过在模型中采用线性输出的方法得到不同N值的预测结果,选取误差指标最小的N值作为最后结果。
9.根据权利要求8所述的一种基于时空分布的风电功率概率密度的预测方法,其特征在于,所述预测包括确定性预测、多部预测及不确定性预测;
其中,多部预测为每一步预测未来12个时间点的数据,在下一个时刻预测前把上一步得到的预测结果与历史特征合并,共同作为下一个模型的输入;
确定性预测:在模型输出层采用线性输出的方式并通过多步预测得到确定性的预测结果;
不确定性预测:在模型输出层采用高斯混合密度网络进行概率密度输出得到风电功率的区间预测结果;根据区间覆盖率CP和区间平均宽度NWP指标评判模型优劣,并根据根据不同的隐含层模型对模型进行改进。
10.根据权利要求9所述的一种基于时空分布的风电功率概率密度的预测方法,其特征在于,所述区间覆盖率CP和区间平均宽度NWP分别为:
其中,c为测试集中真实值落在预测区间内的数目;v为测试集中真实值总数目;Ymax是预测时刻t测试集风电功率最大值,Ymin为预测时刻t测试集风电功率最小值;Ut为预测区间上界;Lt为预测区间下界。
CN202311098724.XA 2023-08-29 2023-08-29 一种基于时空分布的风电功率概率密度的预测方法 Pending CN117096871A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311098724.XA CN117096871A (zh) 2023-08-29 2023-08-29 一种基于时空分布的风电功率概率密度的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311098724.XA CN117096871A (zh) 2023-08-29 2023-08-29 一种基于时空分布的风电功率概率密度的预测方法

Publications (1)

Publication Number Publication Date
CN117096871A true CN117096871A (zh) 2023-11-21

Family

ID=88776983

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311098724.XA Pending CN117096871A (zh) 2023-08-29 2023-08-29 一种基于时空分布的风电功率概率密度的预测方法

Country Status (1)

Country Link
CN (1) CN117096871A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117454124A (zh) * 2023-12-26 2024-01-26 山东大学 一种基于深度学习的船舶运动预测方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117454124A (zh) * 2023-12-26 2024-01-26 山东大学 一种基于深度学习的船舶运动预测方法及系统
CN117454124B (zh) * 2023-12-26 2024-03-29 山东大学 一种基于深度学习的船舶运动预测方法及系统

Similar Documents

Publication Publication Date Title
CN111815033A (zh) 一种基于rcnn和气象时序特征的海上风电功率预测方法
Wang et al. A hybrid optimization-based recurrent neural network for real-time data prediction
CN111461413B (zh) 一种公路路面使用性能检测系统
CN114048930B (zh) 一种超短期风电功率预测方法和装置
CN117096871A (zh) 一种基于时空分布的风电功率概率密度的预测方法
CN115374995A (zh) 一种分布式光伏、小风电场站功率预测方法
CN113222210B (zh) 一种基于多模态生成对抗的台风短期预测方法及装置
CN116415705A (zh) 一种多因素水位预测方法、装置、电子设备和计算机介质
CN114462718A (zh) 基于时间滑动窗口的cnn-gru风电功率预测方法
CN115099296A (zh) 基于深度学习算法的海浪高度预测方法
CN112149883A (zh) 基于fwa-bp神经网络的光伏功率预测方法
CN115713162A (zh) 一种分布式低碳能源站健康状态预警预测方法
Wang et al. Tracking and predicting technological knowledge interactions between artificial intelligence and wind power: Multimethod patent analysis
CN113033898A (zh) 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及系统
CN112802011A (zh) 一种基于vgg-bls的风机叶片缺陷检测方法
CN113723670B (zh) 变时间窗口的光伏发电功率短期预测方法
CN115563848A (zh) 一种基于深度学习的分布式光伏总辐射预测方法及系统
CN112183814A (zh) 一种短期风速预测方法
CN117713688B (zh) 光伏组件在多朝向及倾角下的低效识别与电量提升方法
Shen et al. Screening methodology of correlated wind turbines for wind direction prediction based on yawing manoeuvre data
CN117829822B (zh) 一种电力变压器故障预警方法及系统
CN117408369A (zh) 基于rf-tcn-sa的风电功率超短期预测及误差修正方法
CN117557254A (zh) 一种考虑海洋环境影响的海上风电机组维护决策方法
CN118174294A (zh) 一种短期电力负荷预测方法
CN117910628A (zh) 一种基于aco-cnn-lstm的建筑热负荷预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination