CN115375014A - 一种源荷组合概率预测方法、装置及存储介质 - Google Patents

一种源荷组合概率预测方法、装置及存储介质 Download PDF

Info

Publication number
CN115375014A
CN115375014A CN202210948038.6A CN202210948038A CN115375014A CN 115375014 A CN115375014 A CN 115375014A CN 202210948038 A CN202210948038 A CN 202210948038A CN 115375014 A CN115375014 A CN 115375014A
Authority
CN
China
Prior art keywords
data
prediction
source
source load
convmt
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210948038.6A
Other languages
English (en)
Inventor
胡平昭
戴则梅
张凯锋
胡殿刚
王琛
司晓峰
闪鑫
王毅
罗玉春
付嘉渝
陆娟娟
张元觉
宋霄霄
杨杰
何欣
彭龙
曹国芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
STATE GRID GASU ELECTRIC POWER RESEARCH INSTITUTE
State Grid Corp of China SGCC
Southeast University
State Grid Gansu Electric Power Co Ltd
Nari Technology Co Ltd
State Grid Electric Power Research Institute
Original Assignee
STATE GRID GASU ELECTRIC POWER RESEARCH INSTITUTE
State Grid Corp of China SGCC
Southeast University
State Grid Gansu Electric Power Co Ltd
Nari Technology Co Ltd
State Grid Electric Power Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by STATE GRID GASU ELECTRIC POWER RESEARCH INSTITUTE, State Grid Corp of China SGCC, Southeast University, State Grid Gansu Electric Power Co Ltd, Nari Technology Co Ltd, State Grid Electric Power Research Institute filed Critical STATE GRID GASU ELECTRIC POWER RESEARCH INSTITUTE
Priority to CN202210948038.6A priority Critical patent/CN115375014A/zh
Publication of CN115375014A publication Critical patent/CN115375014A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/003Load forecast, e.g. methods or systems for forecasting future load demand
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Biophysics (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Tourism & Hospitality (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Power Engineering (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种源荷组合概率预测方法、装置及存储介质,方法包括:采集源荷历史数据及对应的气象数据,并进行预处理,获得完整可用的数据组合;将预处理后的数据组合输入训练好的多个ConvMT预测模型中,获得多个预测结果;将各源荷组合预测结果与各自对应的权重相乘,并将乘积进行求和运算,获得最终的源荷组合概率预测结果;其中,所述ConvMT预测模型是采用CNN特征提取模块替换Transformer模型中编码器原有的多头注意力模块后,再采用源荷历史数据及同时间尺度的气象数据训练获取的;所述权重是以Pinball损失函数最小为目标,通过遗传算法进行优化后获取的。本发明可以增强源荷预测的准确性。

Description

一种源荷组合概率预测方法、装置及存储介质
技术领域
本发明涉及一种源荷组合概率预测方法、装置及存储介质,属于电力系统技术领域。
背景技术
在以往的源荷预测研究中,大多将新能源发电侧和负荷侧分开考虑进行预测。研究通过改进LSTM(Long Short-Term Memory,长短时记忆)遗忘门提高概率预测的准确性,并引入分位数回归的概念。在光伏概率预测方面,概率预测通过非参数估计方法实现;在光伏概率密度预测中,常采用模拟退火算法获得近似最优解;然后,利用核密度估计方法将条件分位数预测结果与概率密度预测结果进行拟合。虽然LSTM网络可以绕过单元从而记住更长的时间步骤,因此可以消除一些梯度消失的问题,然而LSTM并没有解决全部问题,LSTM仍然有一条从过去单元到当前单元的顺序路径,这条路使得模型训练更加复杂;另外,虽然LSTM及其衍生能够记住大量更长期的信息,但是它们只能记住100个量级的序列,不能记住更长的序列。
谷歌团队提出的Transformer网络放弃了RNN循环神经网络模型,完全依赖注意机制来提取序列之间的关系。Transformer的一个重要特征是注意力机制,它使该网络能够并行读取和计算数据,并解决RNN及其变体的远程依赖问题。Transformer结构从理论上将传播路径压缩到最短,这使得网络能够处理更复杂的数据信息,并缩短计算时间。Transformer网络解决了更长序列的问题,但是Transformer通常被用于处理语言类的问题,在将Transformer应用在电力预测时,面对大量的数据集,Transformer往往又存在输入数据的处理问题。
发明内容
本发明的目的在于克服现有技术中的不足,提供一种源荷组合概率预测方法、装置及存储介质,可以增强源荷预测的准确性。
为达到上述目的,本发明是采用下述技术方案实现的:
第一方面,本发明提供了一种源荷组合概率预测方法,包括:
采集源荷历史数据及对应的气象数据;
对所述源荷历史数据及气象数据进行预处理,获得完整可用的数据组合;
将预处理后的数据组合输入至预构建并训练好的多个ConvMT预测模型中,获得多个源荷组合预测结果;
将各源荷组合预测结果与各自对应的权重相乘,并将乘积进行求和运算,获得最终的源荷组合概率预测结果;
其中,所述ConvMT预测模型是采用CNN特征提取模块替换Transformer模型中编码器原有的多头注意力模块后,再采用源荷历史数据及同时间尺度的气象数据训练获取的;所述权重是以Pinball损失函数最小为目标,通过遗传算法进行优化后获取的。
结合第一方面,进一步的,所述ConvMT预测模型的训练方法包括:
依据预设的时间间隔采集多组源荷历史数据及对应的气象数据;
根据所采集的多组源荷历史数据及对应的气象数据构建原始数据集;
对原始数据集进行预处理,获得多组完整可用的包含源荷历史数据及对应的气象数据的数据组合,形成样本集;
按照数据组合的采样时间将所述样本集划分为训练集和测试集,所述测试集中数据组合的采样时间均晚于所述训练集中数据组合的采样时间;
从训练集中选取多组数据组合分别输入至多个ConvMT预测模型中进行训练,获取多个ConvMT预测模型的训练集源荷预测结果;
将测试集中的源荷历史数据作为真实值,将同一时刻的训练集源荷预测结果作为预测值,根据真实值与预测值计算MAPE值;
以MAPE值最小为优化目标对ConvMT预测模型进行参数优化,获取最终训练好的ConvMT预测模型。
结合第一方面,进一步的,所述预处理包括:
对源荷历史数据及对应的气象数据进行异常值检测,若存在异常值,则采用邻近正常值代替所述异常值;
对源荷历史数据及对应的气象数据处理异常数据后进行归一化处理,线性变换到(1,2)范围内。
结合第一方面,进一步的,所述原始数据集是采用Bootstrap方法从所采集的源荷历史数据及对应的气象数据中选取多组数据组合而构建的。
结合第一方面,进一步的,所述Pinball损失函数的表达式如下:
Figure BDA0003787413730000031
式中:
Figure BDA0003787413730000032
为Pinball损失函数值;I为指示函数;α为在预设的分位数下源荷组合概率预测结果的分布函数;yi,t为负荷的真实值;
Figure BDA0003787413730000033
为所求分位点;当
Figure BDA0003787413730000034
时,
Figure BDA0003787413730000035
即等价为平均绝对误差,所求得的分位点即为中位数;N为样本个数;T为日前预测的输出长度。
结合第一方面,进一步的,分布函数α的值通过下述方法确定:
(1)αpMAXpMIN=1
(2)αpMAXpMIN=p%
式中,αpMAX为pMAX曲线对应的α值,αpMIN为pMIN曲线对应的α值,p介于0-100之间,p%表示真实值落在pMIN和pMAX曲线之间的概率。
结合第一方面,进一步的,所述源荷历史数据包括电网发电侧的风力发电量和光伏发电量、以及电网负荷侧的用电量;所述气象数据包括与源荷数据相关的温度、湿度、压强、辐照度和风速。
结合第一方面,进一步的,所述CNN特征提取模块为3×3的CNN特征提取模块,相应的,所述ConvMT预测模型的编码器的输入采用13×72的数据矩阵,所述数据矩阵是由以下8种数据组成的13维矩阵:
风电、光伏、负荷、压强、湿度、温度、风速、辐照度。
第二方面,进一步的,本发明提供一种源荷组合概率预测装置,包括:
采集模块:用于采集源荷历史数据及对应的气象数据;
预处理模块:用于对所述源荷历史数据及气象数据进行预处理,获得完整可用的数据组合;
预测模块:用于将预处理后的数据组合输入至预构建并训练好的多个ConvMT预测模型中,获得多个源荷组合预测结果;
获取模块:用于将各源荷组合预测结果与各自对应的权重相乘,并将乘积进行求和运算,获得最终的源荷组合概率预测结果;
其中,所述ConvMT预测模型是采用CNN特征提取模块替换Transformer模型中编码器原有的多头注意力模块后,再采用源荷历史数据及同时间尺度的气象数据训练获取的;所述权重是以Pinball损失函数最小为目标,通过遗传算法进行优化后获取的。
结合第二方面,进一步的,该装置还包括所述训练模块,所述训练模块包括:
数据集构建单元:用于依据预设的时间间隔采集多组源荷历史数据及对应的气象数据,并根据所采集多组源荷历史数据及对应的气象数据构建原始数据集;
样本集形成单元:用于对原始数据集进行预处理,获得多组完整可用的包含源荷历史数据及对应的气象数据的数据组合,形成样本集;
样本集划分单元:用于按照数据组合的采样时间将所述样本集划分为训练集和测试集,所述测试集中数据组合的采样时间均晚于所述训练集中数据组合的采样时间;
训练单元:用于从训练集中选取多组数据组合分别输入至多个ConvMT预测模型中进行训练,获取多个ConvMT预测模型的训练集源荷预测结果;
MAPE值计算单元:用于将测试集中的源荷历史数据作为真实值,将同一时刻的训练集源荷预测结果作为预测值,根据真实值与预测值计算MAPE值;
参数优化单元:用于以MAPE值最小为优化目标对ConvMT预测模型进行参数优化,获取最终训练好的ConvMT预测模型。
第三方面,本发明提供一种源荷组合概率预测装置,包括处理器及存储介质;
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行第一方面任一项所述方法的步骤。
第四方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面任一项所述方法的步骤。
与现有技术相比,本发明所达到的有益效果:
本发明采用的ConvMT预测模型是采用CNN特征提取模块替换Transformer模型中编码器原有的多头注意力模块后,再采用源荷历史数据及同时间尺度的气象数据训练获取的;所述各个ConvMT模型预测的源荷组合预测结果的权重,是以Pinball损失函数最小为目标,通过遗传算法优化之后获取的;
采用CNN特征提取模块替换Transformer模型中编码器原有的多头注意力模块,可以提取数据特征,避免了由于源荷和气象数据内部耦合性关系不明确导致无法手动选择特征参数的问题,避免了早期复杂的数据处理操作。
附图说明
图1是本发明实施例提供的源荷组合概率预测方法的流程图;
图2是本发明实施例提供的ConvMT预测模型的结构示意图;
图3是采用本发明实施例提供的源荷组合概率预测方法预测的风电预测结果图;
图4是采用本发明实施例提供的源荷组合概率预测方法预测的光伏预测结果图;
图5是采用本发明实施例提供的源荷组合概率预测方法预测的负荷预测结果图。
具体实施方式
下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
实施例一:
图1是本发明实施例一提供的一种源荷组合概率预测方法的流程图。本流程图仅仅示出了本实施例所述方法的逻辑顺序,在互不冲突的前提下,在本发明其它可能的实施例中,可以以不同于图1所示的顺序完成所示出或描述的步骤。
本实施例提供的源荷组合概率预测方法可应用于终端,可以由源荷组合概率预测装置来执行,该装置可以由软件和/或硬件的方式实现,该装置可以集成在终端中,例如:任一具备通信功能的智能手机,平板电脑或计算机设备。参见图1,本实施的方法具体包括如下步骤:
步骤一:采集源荷历史数据及对应的气象数据;
新能源发电侧和负荷侧都受到天气因素的影响,比如:太阳辐射强度、温度、等天气因素对光伏发电存在巨大影响;负载侧的功耗也将根据天气条件而变化,比如:夏季空调使用量增加导致用电量增加。
因此,在本发明实施例中不仅考虑了源荷历史数据,同时考虑了气象数据,以进一步提高预测结果的准确性。作为本发明的一种实施例,源荷历史数据可以包括:电网发电侧的风力发电量和光伏发电量、以及电网负荷侧的用电量;所述气象数据可以包括温度、湿度、压强、辐照度和风速。需要说明的是,源荷历史数据与气象数据作为一个数据组合,应为同一时间尺度,两者相对应。
步骤二:对所述源荷历史数据及气象数据进行预处理,获得完整可用的数据组合;
在某些实施例中,所采集的源荷历史数据及对应的气象数据中会存在少量异常数据,为此,在将数据输入至ConvMT预测模型之前,需要对所述源荷历史数据及对应的气象数据进行异常值检测,对于异常值可以使用邻近的正常值代替;
为了消除奇异数据导致的不良影响以及加速后续损失函数的收敛,在本发明实施例中,对于异常处理后的数据还需要进一步进行归一化处理,将数据线性变换到(1,2)范围内,归一化处理的具体公式如公式(1)所示:
Figure BDA0003787413730000081
式中:x′为归一化后的数据值,x为原数据值,xmin为数据集中该类数据的最小值,xmax为数据集中该类数据的最大值。
步骤三:将预处理后的数据组合输入至预构建并训练好的多个ConvMT预测模型中,获得多个源荷组合预测结果;
本发明实施例所述的ConvMT(Probability-CNN-Multi-Transformer)预测模型是基于Transformer模型构建、采用源荷历史数据及同时间尺度的气象数据训练获取的;具体而言,ConvMT预测模型是采用CNN特征提取模块替换Transformer模型中编码器原有的多头注意力模块获取的。
如图2所示,是本发明实施例提供的ConvMT预测模型的结构示意图,ConvMT预测模型是在Transformer模型的基础上构建的,Transformer模型主要包括位置嵌入、编码器和解码器部分,其中编码器和解码器均包含多头注意力层、前向传播层和带掩码的前向传播层等。ConvMT预测模型去掉了Transformer模型的位置嵌入部分,采用CNN特征提取模块代替Transformer模型中编码器的多头注意力模块,用于提取源荷和气象数据之间的特征。由于源荷和气象数据内部耦合性关系并不明确,难以手动选择特征,加入CNN特征提取模块后,预测模型不需要手动选择特征参数,在数据集上训练权重后,可以通过CNN特征提取模块直接获得数据特征,避免早期复杂的数据处理。如表1所示,是本发明实施例提供的一种ConvMT预测模型参数表:
表1 ConvMT预测模型参数表
参数类型 参数值
编码器层数 8
编码器输出维数 256
解码器前向层大小 256
解码器多头注意力头数 8
解码器层数 8
可选的,CNN特征提取模块为3×3的CNN特征提取模块,ConvMT预测模型的编码器的输入采用13×72的数据矩阵,所述数据矩阵是由以下8种数据组成的13维矩阵:
风电、光伏、负荷、压强、湿度、温度、风速、辐照度。
ConvMT预测模型中3个解码器的输入1、输入2、输入3分别是风电、光伏、负载和对应气象数据的历史数据。把输入1、输入2、输入3的数据合并形成的二维矩阵就是构成编码器的输入部分。ConvMT预测模型使用这种输入结构可以将源荷的关联性代入预测模型,并实现对风电、光伏和负载三者有功功率的分别预测。
ConvMT预测模型中的前向传播层用于提供非线性特征变换能力。
步骤四:将各源荷组合预测结果与各自对应的权重相乘,并将乘积进行求和运算,获得最终的源荷组合概率预测结果;
需要说明的是,在本申请中源荷组合概率预测结果是指:使用单编码器多解码器结构将源荷耦合性代入ConvMT模型进行预测,并用分位数表示预测结果的预测。
在本发明实施例中使用Pinball(弹球)损失函数优化获取所述权重,Pinball损失函数是一个用来衡量概率预测结果准确性的函数,根据Pinball损失函数计算公式计算弹球损失值,弹球损失值越小,概率预测结果越准确。
Pinball损失函数作为遗传算法的目标函数,在优化过程中需要手动输入分位数的相关信息。Pinball损失函数可定义为
Figure BDA0003787413730000101
式中:
Figure BDA0003787413730000106
为Pinball损失函数值;I为指示函数;α为在预设的分位数下源荷组合概率预测结果的分布函数;yi,t为负荷的真实值;
Figure BDA0003787413730000102
为所求分位点;当
Figure BDA0003787413730000103
时,
Figure BDA0003787413730000104
即等价为平均绝对误差,所求得的分位点即为中位数;N为样本个数;T为日前预测的输出长度,此处为1h。
多组源荷组合预测结果可视为一个正态分布,在正态分布中,中点处为真实值的概率最大,以此处为中心向两边扩展可以得到真实值落在某区间内的总概率。因此,分布函数α的值通过下述方法确定:
(1)αpMAXpMIN=1
(2)αpMAXpMIN=p%
式中,αpMAX为pMAX曲线对应的α值,αpMIN为pMIN曲线对应的α值,p介于0-100之间,p%表示真实值落在pMIN和pMAX曲线之间的概率。
采用遗传算法进行优化过程中,适应度函数值的计算公式如下:
Figure BDA0003787413730000105
式中,loss10是优化前的Pinball Loss函数结果,lossi为训练模型i的Pinball损失函数结果;i=1,2,3,…n,n表示ConvMT预测模型的总个数。
电压越限惩罚函数为:
Figure BDA0003787413730000111
Figure BDA0003787413730000112
式中,F是加入越限惩罚函数后的适应度函数值;λ是一个比f更高数量级的一个大值用于增大公式后面部分的值,使该个体在后续步骤更容易被淘汰;Pi是个体i被赋予的权重值;Pil是一中间参数,用于引入分段函数值,从而区分不同情况下的权重值,使权重值越限时得以受到惩罚;Pimax是优化对象权重要求范围的最大值;Pimin是优化对象权重要求范围的最小值;
遗传算法适应度为:
Figure BDA0003787413730000113
以ConvMT预测模型作为个体,在遗传算法中的遗传操作方法使用轮盘赌法,保留适应度最大的个体,个体i被选取的概率Pi为:
Figure BDA0003787413730000114
式中:Fi是第i个ConvMT预测模型加入越限惩罚函数后的适应度函数值;
遗传算法中取两个个体,根据交叉概率判别是否需要进行交叉操作,如满足交叉概率要求,则进行交叉操作,交叉概率公式为:
Figure BDA0003787413730000121
式中,Pc是个体i进行交叉操作的概率;Pc1、Pc2是两个设定好的值,在本发明实施例中,Pc1=0.9,Pc2=0.6;favg是当代种群的平均适应度值;fmax是当代种群的最大个体适应度值;f'是需要交叉的两个个体中较大的适应度值。
遗传算法中取一个个体,根据变异概率判断是否需要进行变异操作,如满足变异概率要求,则进行变异操作,变异概率公式为:
Figure BDA0003787413730000122
式中,Pm为个体需要进行变异操作的概率;Pm1、Pm2是两个设定好的值,Pm1=0.1,Pm2=0.01;favg是当代种群的平均适应度值;fmax是当代种群的最大个体适应度值;f"是变异个体的适应度值。
淘汰操作的概率设置为Ptt=0.1,得出需淘汰的个体数Ntt,用第Ntt个个体的值覆盖前面Ntt个个体的值。
假设:ConvMT预测模型输出的源荷组合预测的3组结果中的风电结果为(单位:MWh):
1001,895,1102,1233
999,897,1101,1235
1000,896,1100,1232
风电的真实值为:1000,897,1102,1234
在90分位数下,计算90MIN曲线结果时,Pinball损失损失函数公式中的各参数为
Figure BDA0003787413730000131
N=3,T=4,α=5%,yi,1=1000,yi,2=897,yi,3=1102,yi,4=1234。
同时,假设通过遗传算法优化Pinball损失后的权重分别为:
0.32,0.34,0.32,0.33
0.35,0.33,0.33,0.33
0.33,0.33,0.35,0.32
则最终的90MIN曲线对应点的结果4个数据分别为:
0.32×1001+0.35×999+0.33×1000=999.97
0.34×895+0.33×897+0.33×896=895.99
0.32×1102+0.33×1101+0.35×1100=1100.97
0.33×1233+0.33×1235+0.34×1232=1233.32
其他概率预测曲线的计算方法同理。
作为本发明的一种实施例,所述ConvMT预测模型的训练方法包括:
步骤A:依据预设的时间间隔采集多组源荷历史数据及对应的气象数据,并根据所采集的数据构建原始数据集;
时间间隔为预设时间,在本发明实施例中,数据采集的总时间长度可以为两年,时间间隔可以设置为1个小时。
步骤B:对原始数据集进行预处理,获得多组完整可用的包含源荷历史数据及对应的气象数据的数据组合,形成样本集;
对原始数据集进行预处理的方法同前文步骤二中记载方法相同,即包括异常值处理,以及对异常值处理后的数据进行归一化处理,使原始数据集中的数据线性变换到(1,2)范围内。
步骤C:按照数据组合的采样时间将所述样本集划分为训练集和测试集,所述测试集中数据组合的采样时间均晚于所述训练集中数据组合的采样时间;
以两年的采样时间总长度为例,训练集可以包含前23个月的源荷历史数据及对应的气象数据,测试集包括最后1个月的源荷历史数据及对应的气象数据。这样划分的目的在于采用训练集中的数据组合进行预测最后1个月的源荷组合概率时,可以将测试集中的源荷历史数据作为真实值对预测结果进行验证。
步骤D:从训练集中选取多组数据组合分别输入至多个ConvMT预测模型中进行训练,获取多个训练后的ConvMT预测模型及对应的训练集源荷预测结果;
作为本发明的一种实施例,用于训练ConvMT预测模型的数据组合可以使用Bootstrap方法选取。Bootstrap方法是一种统计估计方法,利用Bootstrap方法从训练集中选取多组数据组合输入至ConvMT预测模型中进行训练,该方法不需要对ConvMT预测模型进行其他假设,也不需要添加新的观测值,具有鲁棒性强、效率高的特点。
步骤E:将测试集中的源荷历史数据作为真实值,将同一时刻的训练集源荷预测结果作为预测值,根据真实值与预测值计算MAPE值;
对于训练后的ConvMT预测模型得到的源荷预测结果,需要进一步优化,在本发明实施例中使用的是平均绝对百分比误差(MAPE)函数进行优化,MAPE值计算公式如下:
Figure BDA0003787413730000141
式中,
Figure BDA0003787413730000142
为预测值,yi为真实值,m为ConvMT预测模型预测数据点的总个数。在预测中,一般认为MAPE值小于10时,对应的预测值精度较高,若存在某个真实值为0,MAPE就无法进行计算,因此,对于异常处理后的数据进行归一化处理,使源荷历史数据缩放到1至2之间,便于使用MAPE函数进行优化,来得到最终的预测结果,MAPE值可以用于评判最终预测结果的准确性。
步骤F:以MAPE值最小为优化目标对ConvMT预测模型进行参数优化,获取最终训练好的ConvMT预测模型。
训练过程中,采用测试集对预测结果进行验证时,若当前预测模型所得预测结果优于前次训练的得到的预测结果,则保存该预测模型参数,否则丢弃该预测模型。通过多次训练后,选择在测试集数据中表现最好的预测模型作为最终的训练好的预测模型。
如图3~5所示,是采用Bootstrap方法从样本集中选取出20组数据组合对20个ConvMT预测模型进行训练,然后利用遗传优化算法对弹球损失函数进行优化,得到最终的概率预测结果。3张图中横坐标表示时间,单位为小时(h);纵坐标依据预测数据种类的不同,分别为风电功率、光伏功率、负荷功率,单位为MWh;True曲线代表真实验证集的功率数据。90MAX和90MIN分别代表真实值落在90MAX和90MIN曲线之间区间的概率为90%时的上限与下限;在源荷组合概率预测结果中,90MIN曲线对应α=5%的情况,90MAX曲线对应α=95%的情况,60MIN曲线对应α=20%的情况,60MAX曲线对应α=80%的情况从图中可以看出,True曲线基本上可以被图中90分位点的最大功率值和最小功率值包围住,负荷预测图中的概率区间较窄。原因可能是负荷功率的不确定性小于新能源的不确定性。新能源发电受到天气因素的强烈影响,并随天气变化而发生巨大波动。光伏发电基本上取决于太阳辐射强度,不确定性相对较小,风力发电还受到风速和气压等因素的影响,不确定性更大。在实际预测过程中,由于气象因素的预测也具有很大的不确定性,会进一步加大预测产生的误差。这些因素的综合作用使得新能源发电具有很强的波动性和不规律性,增加了新能源预测的不确定性。虽然负荷也受到天气因素的影响,但影响程度没有那么大,总体负荷功率仍呈现出相对明确的规律性,所以相较之下负荷预测的结果比新能源预测的结果好。
实施例二:
本实施例提供一种源荷组合概率预测装置,所述装置包括:
采集模块:用于采集源荷历史数据及对应的气象数据;
预处理模块:用于对所述源荷历史数据及气象数据进行预处理,获得完整可用的数据组合;
预测模块:用于将预处理后的数据组合输入至预构建并训练好的多个ConvMT预测模型中,获得多个源荷组合预测结果;
获取模块:将各源荷组合预测结果与各自对应的权重相乘,并将乘积进行求和运算,获得最终的概率预测结果;
其中,所述ConvMT预测模型是基于Transformer模型构建、采用源荷历史数据及同时间尺度的气象数据训练获取的;具体而言,ConvMT预测模型是采用CNN特征提取模块替换Transformer模型中编码器原有的多头注意力模块获取的。所述权重是以Pinball损失函数最小为目标,通过遗传算法优化之后获取的。在优化获取所述权重时,预设的分位数需要预先输入至Pinball损失函数中。
本发明实施例提供的装置,还包括所述训练模块,所述训练模块包括:
数据集构建单元:用于依据预设的时间间隔采集多组源荷历史数据及对应的气象数据,构建原始数据集;
样本集形成单元:用于对原始数据集进行预处理,获得多组完整可用的包含源荷历史数据及对应的气象数据的数据组合,形成样本集;
样本集划分单元:用于按照数据组合的采样时间将所述样本集划分为训练集和测试集,所述测试集中数据组合的采样时间均晚于所述训练集中数据组合的采样时间;
训练单元:用于从训练集中选取多组数据组合分别输入至多个ConvMT预测模型中进行训练,获取多个训练后的ConvMT预测模型及对应的训练集源荷预测结果;
MAPE值计算单元:用于将测试集中的源荷历史数据作为真实值,将同一时刻的训练集源荷预测结果作为预测值,根据真实值与预测值计算MAPE值;
参数优化单元:用于以MAPE值最小为优化目标对ConvMT预测模型进行参数优化,获取最终训练好的ConvMT预测模型。
本发明实施例所提供的源荷组合概率预测装置可执行本发明任意实施例所提供的源荷组合概率预测方法,具备执行方法相应的功能模块和有益效果。
实施例三:
本发明实施例还提供了一种源荷组合概率预测装置,包括处理器及存储介质;
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行实施例一所述方法的步骤。
实施例四:
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现实施例一所述方法的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (12)

1.一种源荷组合概率预测方法,其特征在于,包括:
采集源荷历史数据及对应的气象数据;
对所述源荷历史数据及气象数据进行预处理,获得完整可用的数据组合;
将预处理后的数据组合输入至预构建并训练好的多个ConvMT预测模型中,获得多个源荷组合预测结果;
将各源荷组合预测结果与各自对应的权重相乘,并将乘积进行求和运算,获得最终的源荷组合概率预测结果;
其中,所述ConvMT预测模型是采用CNN特征提取模块替换Transformer模型中编码器原有的多头注意力模块后,再采用源荷历史数据及同时间尺度的气象数据训练获取的;所述权重是以Pinball损失函数最小为目标,通过遗传算法进行优化后获取的。
2.根据权利要求1所述的源荷组合概率预测方法,其特征在于,所述ConvMT预测模型的训练方法包括:
依据预设的时间间隔采集多组源荷历史数据及对应的气象数据;
根据所采集的多组源荷历史数据及对应的气象数据构建原始数据集;
对原始数据集进行预处理,获得多组完整可用的包含源荷历史数据及对应的气象数据的数据组合,形成样本集;
按照数据组合的采样时间将所述样本集划分为训练集和测试集,所述测试集中数据组合的采样时间均晚于所述训练集中数据组合的采样时间;
从训练集中选取多组数据组合分别输入至多个ConvMT预测模型中进行训练,获取多个ConvMT预测模型的训练集源荷预测结果;
将测试集中的源荷历史数据作为真实值,将同一时刻的训练集源荷预测结果作为预测值,根据真实值与预测值计算MAPE值;
以MAPE值最小为优化目标对ConvMT预测模型进行参数优化,获取最终训练好的ConvMT预测模型。
3.根据权利要求1或2所述的源荷组合概率预测方法,其特征在于,所述预处理包括:
对源荷历史数据及对应的气象数据进行异常值检测,若存在异常值,则采用邻近正常值代替所述异常值;
对源荷历史数据及对应的气象数据处理异常数据后进行归一化处理,线性变换到(1,2)范围内。
4.根据权利要求2所述的源荷组合概率预测方法,其特征在于,所述原始数据集是采用Bootstrap方法从所采集的源荷历史数据及对应的气象数据中选取多组数据组合而构建的。
5.根据权利要求1所述的源荷组合概率预测方法,其特征在于,所述Pinball损失函数的表达式如下:
Figure FDA0003787413720000021
式中:
Figure FDA0003787413720000022
为Pinball损失函数值;I为指示函数;α为在预设的分位数下源荷组合概率预测结果的分布函数;yi,t为负荷的真实值;
Figure FDA0003787413720000023
为所求分位点;当
Figure FDA0003787413720000024
时,
Figure FDA0003787413720000025
即等价为平均绝对误差,所求得的分位点即为中位数;N为样本个数;T为日前预测的输出长度。
6.权利要求5所述的源荷组合概率预测方法,其特征在于,分布函数α的值通过下述方法确定:
(1)αnMAXnMIN=1
(2)αnMAXnMIN=n%
式中,αnMAX为nMAX曲线对应的α值,αnMIN为nMIN曲线对应的α值,n介于0-100之间,n%表示真实值落在nMIN和nMAX曲线之间的概率。
7.根据权利要求1所述的源荷组合概率预测方法,其特征在于,所述源荷历史数据包括电网发电侧的风力发电量和光伏发电量、以及电网负荷侧的用电量;所述气象数据包括与源荷数据相关的温度、湿度、压强、辐照度和风速。
8.根据权利要求1所述的源荷组合概率预测方法,其特征在于,所述CNN特征提取模块为3×3的CNN特征提取模块,相应的,所述ConvMT预测模型的编码器的输入采用13×72的数据矩阵,所述数据矩阵是由以下8种数据组成的13维矩阵:
风电、光伏、负荷、压强、湿度、温度、风速、辐照度。
9.一种源荷组合概率预测装置,其特征在于,包括:
采集模块:用于采集源荷历史数据及对应的气象数据;
预处理模块:用于对所述源荷历史数据及气象数据进行预处理,获得完整可用的数据组合;
预测模块:用于将预处理后的数据组合输入至预构建并训练好的多个ConvMT预测模型中,获得多个源荷组合预测结果;
获取模块:用于将各源荷组合预测结果与各自对应的权重相乘,并将乘积进行求和运算,获得最终的源荷组合概率预测结果;
其中,所述ConvMT预测模型是采用CNN特征提取模块替换Transformer模型中编码器原有的多头注意力模块后,再采用源荷历史数据及同时间尺度的气象数据训练获取的;所述权重是以Pinball损失函数最小为目标,通过遗传算法进行优化后获取的。
10.根据权利要求9所述的源荷组合概率预测装置,其特征在于,该装置还包括所述训练模块,所述训练模块包括:
数据集构建单元:用于依据预设的时间间隔采集多组源荷历史数据及对应的气象数据,并根据所采集多组源荷历史数据及对应的气象数据构建原始数据集;
样本集形成单元:用于对原始数据集进行预处理,获得多组完整可用的包含源荷历史数据及对应的气象数据的数据组合,形成样本集;
样本集划分单元:用于按照数据组合的采样时间将所述样本集划分为训练集和测试集,所述测试集中数据组合的采样时间均晚于所述训练集中数据组合的采样时间;
训练单元:用于从训练集中选取多组数据组合分别输入至多个ConvMT预测模型中进行训练,获取多个ConvMT预测模型的训练集源荷预测结果;
MAPE值计算单元:用于将测试集中的源荷历史数据作为真实值,将同一时刻的训练集源荷预测结果作为预测值,根据真实值与预测值计算MAPE值;
参数优化单元:用于以MAPE值最小为优化目标对ConvMT预测模型进行参数优化,获取最终训练好的ConvMT预测模型。
11.一种源荷组合概率预测装置,其特征在于,包括处理器及存储介质;
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据权利要求1~8任一项所述方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1~8任一项所述方法的步骤。
CN202210948038.6A 2022-08-08 2022-08-08 一种源荷组合概率预测方法、装置及存储介质 Pending CN115375014A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210948038.6A CN115375014A (zh) 2022-08-08 2022-08-08 一种源荷组合概率预测方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210948038.6A CN115375014A (zh) 2022-08-08 2022-08-08 一种源荷组合概率预测方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN115375014A true CN115375014A (zh) 2022-11-22

Family

ID=84062848

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210948038.6A Pending CN115375014A (zh) 2022-08-08 2022-08-08 一种源荷组合概率预测方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN115375014A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115882454A (zh) * 2023-02-09 2023-03-31 国网浙江省电力有限公司宁波供电公司 基于多元信息融合的源荷功率预测方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115882454A (zh) * 2023-02-09 2023-03-31 国网浙江省电力有限公司宁波供电公司 基于多元信息融合的源荷功率预测方法及系统
CN115882454B (zh) * 2023-02-09 2023-08-15 国网浙江省电力有限公司宁波供电公司 基于多元信息融合的源荷功率预测方法及系统

Similar Documents

Publication Publication Date Title
CN112001439A (zh) 基于gbdt的商场建筑空调冷负荷预测方法、存储介质及设备
CN108022001A (zh) 基于pca和分位数回归森林的短期负荷概率密度预测方法
CN111861013B (zh) 一种电力负荷预测方法及装置
CN113449919B (zh) 一种基于特征和趋势感知的用电量预测方法及系统
CN113869616A (zh) 一种自适应的居民用户负荷预测方法
CN113469427A (zh) 基于卷积lstm的光伏电站日前发电量预测方法及系统
CN111242355A (zh) 一种基于贝叶斯神经网络的光伏概率预测方法及系统
CN113344288A (zh) 梯级水电站群水位预测方法、装置及计算机可读存储介质
CN114330934A (zh) 一种模型参数自适应的gru新能源短期发电功率预测方法
CN115470862A (zh) 动态自适应负荷预测模型组合方法
CN112348287A (zh) 基于lstm分位数回归的电力系统短期负荷概率密度预测方法
CN116629416A (zh) 光伏电站功率预测方法及装置
CN116599050A (zh) 基于自注意力机制的光伏预测方法及相关装置
CN115375014A (zh) 一种源荷组合概率预测方法、装置及存储介质
CN115238854A (zh) 一种基于tcn-lstm-am的短期负荷预测方法
CN114118401A (zh) 基于神经网络的配电网络流量预测方法、系统、装置及存储介质
CN117407681B (zh) 一种基于向量聚类的时序数据预测模型建立方法
CN116826745A (zh) 一种电力系统背景下的分层分区短期负荷预测方法及系统
CN115481788B (zh) 相变储能系统负荷预测方法及系统
CN115907131A (zh) 一种北方地区电采暖负荷预测模型搭建方法和系统
CN116663727A (zh) 一种光伏功率预测方法及系统
CN114169416B (zh) 一种基于迁移学习的小样本集下短期负荷预测方法
CN115759343A (zh) 一种基于e-lstm的用户电量预测方法和装置
CN113762591B (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及系统
CN115563848A (zh) 一种基于深度学习的分布式光伏总辐射预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination