CN114819391B - 基于历史数据集时间跨度优化的光伏发电功率预测方法及系统 - Google Patents
基于历史数据集时间跨度优化的光伏发电功率预测方法及系统 Download PDFInfo
- Publication number
- CN114819391B CN114819391B CN202210547313.3A CN202210547313A CN114819391B CN 114819391 B CN114819391 B CN 114819391B CN 202210547313 A CN202210547313 A CN 202210547313A CN 114819391 B CN114819391 B CN 114819391B
- Authority
- CN
- China
- Prior art keywords
- data set
- historical data
- power generation
- prediction
- photovoltaic power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010248 power generation Methods 0.000 title claims abstract description 160
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000005457 optimization Methods 0.000 title claims abstract description 19
- 238000004422 calculation algorithm Methods 0.000 claims description 29
- 238000007781 pre-processing Methods 0.000 claims description 19
- 230000003247 decreasing effect Effects 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 7
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 3
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims 3
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims 3
- 238000004364 calculation method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/004—Generation forecast, e.g. methods or systems for forecasting future energy generation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Power Engineering (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Photovoltaic Devices (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出一种基于历史数据集时间跨度优化的光伏发电功率预测方法,涉及光伏发电预测的技术领域,首先确定用于光伏发电功率预测的历史功率数据来源,按时间跨度调整用于预测光伏发电功率的历史数据集的样本数据数目,在历史数据集的数据样本数设置值的限定下,获取预测误差指标随历史数据集的样本数变化的趋势曲线,在预测误差指标最优点附近搜寻最优的历史数据集样本数,根据调整后的历史数据集重新进行预测,往复进行,加快最佳历史数据集样本数的搜寻过程,直至选择最佳的历史数据集样本数目,提高了光伏发电功率预测精度,避免历史数据集选取粗糙,导致计算量大及干扰大的问题。
Description
技术领域
本发明涉及光伏发电预测的技术领域,更具体地,涉及一种基于历史数据集时间跨度优化的光伏发电功率预测方法及系统。
背景技术
光伏发电功率预测是高效利用太阳能资源的前提和基础,对提升光伏发电消纳能力,保障系统安全起着至关重要的作用。一个高效稳定的光伏发电系统,必然要对光伏发电功率进行预测,进而克服控制系统的滞后性,提升系统的效率,同时参照预测结果又能提前进行传统能源调度以达到电力系统的功率平衡,从而保障电力系统的安全稳定运行。在具体光伏发电功率预测的过程中,预测数值越准确,输出功率也就更加稳定,对电网造成的不良影响越小。
由于光伏发电系统受气象环境因素、太阳能资源变化的影响较大,具有较强的间歇性和波动性,对光伏发电功率的预测提出了挑战,从预测精度来看,即使目前存在各种智能算法应用于光伏发电预测中,但光伏发电功率预测的平均绝对百分比误差(MAPE)的整体水平仍在10%左右,商业应用的预测软件MAPE超过15%,与电力系统和工业产业的应用要求差距很大,更难以满足日益提高的光伏发电功率精度需求。
现有技术公开了一种发电功率预测方法,包括以下步骤:采集历史发电功率数据,并根据历史发电功率数据获取发电影响因素;对历史发电功率数据进行预处理,得到预处理后历史发电功率数据,然后根据发电影响因素和预处理后历史发电功率数据,建立发电功率预测模型,最后使用发电功率预测模型得到发电功率预测结果。在该方案中,历史数据的处理主要是对于历史发电功率数据中发电影响因素和数据本身的归一化处理、异常数据提出、缺失值补充以及降维处理等,在整个预测过程中,对于历史数据集,依据经验设定为一定时间跨度下的固定值或者笼统地选取所有已获得的数据,历史数据集选取方式粗糙,使得光伏发电功率的预测精度大受影响。实际上,历史数据集的选取对光伏功率预测起着关键性的作用,在实际预测中,获得的数据可能很多,但过多的选取历史数据,既增加了计算量又可能引入不必要的干扰,如果选取的历史数据集时间跨度太长,历史数据集的数目选取则较大,不仅仅会使得预测计算量增大,也有可能引入过期的干扰因素而影响预测精度,而选取的历史数据时间跨度过短,历史数据集的数目选取较少,则会使得有效的历史数据流失而使得预测能获得的信息量不够完整,同样也影响预测精度。
发明内容
为解决传统光伏发电预测时,由于历史数据集选取粗糙,导致计算量大及干扰大的问题,本发明提出一种基于历史数据集时间跨度优化的光伏发电功率预测方法及系统,对历史数据集时间跨度进行优化,选取时间跨度下的最佳历史数据集数据样本数目,提高了光伏发电功率的预测精度。
为了达到上述技术效果,本发明的技术方案如下:
一种基于历史数据集时间跨度优化的光伏发电功率预测方法,所述方法包括以下步骤:
S1.确定用于光伏发电功率预测的历史功率数据来源,从历史功率数据来源中选定一定时间跨度下、具有若干数据样本数的历史数据集,并对历史数据集进行预处理;
S2.基于已预处理的历史数据集,利用光伏发电功率预测算法A进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;
S3.以P为历史数据集的数据样本数按时间跨度方向增加的间隔,将历史数据集的数据样本数增加P,利用光伏发电功率预测算法A进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;
S4.判断历史数据集的数据样本数是否达到设置值,若是,执行步骤S5;否则,返回步骤S3;
S5.形成预测误差指标随历史数据集的样本数变化的趋势曲线,确定趋势曲线中的最低点,以最低点对应的时间跨度下样本数目的历史数据集进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;
S6.以P为历史数据集的数据样本数按时间跨度方向增加的间隔,将最低点对应的时间跨度下的历史数据集的数据样本数增加P,然后进行光伏发电功率预测,判断预测误差指标是否减小,若是,将历史数据集的数据样本数增加P,执行步骤S7;否则,以H为历史数据集的数据样本数按时间跨度方向减小的间隔,将历史数据集的数据样本数减少H,H≠P,执行步骤S7;
S7.判断历史数据集的数据样本数是否达到设置值,若是,形成预测误差指标随历史数据集的样本数变化的趋势曲线,确定趋势曲线中的拐点,以拐点对应的时间跨度下样本数目的历史数据集进行光伏发电功率预测;否则,返回步骤S6。
优选地,在步骤S1中,从历史功率数据来源中选定一定时间跨度下、具有若干数据样本数的历史数据集时,以历史功率数据来源对应的时间跨度为基础,自历史功率来源中选取最新近时刻开始的时间跨度下、具有若干数据样本数的数据集作为历史数据集。
优选地,所述的预处理操作包括对历史数据集中的数据进行数据清洗,以去除历史数据集中的异常数据和干扰。
优选地,所述的预处理操作还包括聚类,在聚类时,以光伏发电系统的运行工况和运行环境为聚类基础进行聚类。
优选地,在步骤S3及步骤S6中,将历史数据集的数据样本数增加P,利用光伏发电功率预测算法A进行光伏发电功率预测前,数据样本数增加后的历史数据数据集也进行预处理操作。
优选地,光伏发电功率预测算法A为长短期记忆网络法LSTM或极限学习机ELM或非线性自回归神经网络NARX或支持向量回归SVR。
优选地,所述预测误差指标选用平均绝对百分比误差MAPE,计算平均绝对百分比误差MAPE的公式为:
优选地,平均绝对百分比误差MAPE越小,光伏发电功率预测结果越好,反之,光伏发电功率预测结果越差。
优选地,在步骤S5中,确定趋势曲线中的最低点时,通过多项式拟合的方式将趋势曲线拟合,然后获得趋势曲线的拟合表达式,根据拟合表达式确定确定趋势曲线中的最低点。
本申请还提出一种基于历史数据集时间跨度优化的光伏发电功率预测系统,所述系统包括:
数据预处理模块,确定用于光伏发电功率预测的历史功率数据来源,从历史功率数据来源中选定一定时间跨度下、具有若干数据样本数的历史数据集,并对历史数据集进行预处理;
初始预测模块,基于已预处理的历史数据集,利用光伏发电功率预测算法A进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;
变换预测模块,以P为历史数据集的数据样本数按时间跨度方向增加的间隔,将历史数据集的数据样本数增加P,利用光伏发电功率预测算法A进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;
第一判断模块,用于判断历史数据集的数据样本数是否达到设置值,若是,形成预测误差指标随历史数据集的样本数变化的趋势曲线,确定趋势曲线中的最低点,以最低点对应的时间跨度下样本数目的历史数据集进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;否则,在变换预测模块中以P为历史数据集的数据样本数增减变换间隔,将历史数据集的数据样本数增加P,利用光伏发电功率预测算法A进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;
预测判断模块,以P为历史数据集的数据样本数按时间跨度方向增加的间隔,将最低点对应的时间跨度下的历史数据集的数据样本数增加P,然后进行光伏发电功率预测,判断预测误差指标是否减小,若是,将历史数据集的数据样本数增加P,输入第二判断模块;否则,以H为历史数据集的数据样本数按时间跨度方向减小的间隔,将历史数据集的数据样本数减少H,H≠P,输入第二判断模块;
第二判断模块,判断历史数据集的数据样本数是否达到设置值,若是,形成预测误差指标随历史数据集的样本数变化的趋势曲线,确定趋势曲线中的拐点,以拐点对应的时间跨度下样本数目的历史数据集进行光伏发电功率预测;否则,返回预测判断模块。
与现有技术相比,本发明技术方案的有益效果是:
本发明提出一种基于历史数据集时间跨度优化的光伏发电功率预测方法及系统,首先确定用于光伏发电功率预测的历史功率数据来源,以历史数据集在时间跨度下的样本数目作为调整对象,按时间跨度调整用于预测光伏发电功率的历史数据集的样本数据数目,在历史数据集的数据样本数设置值的限定下,获取预测误差指标随历史数据集的样本数变化的趋势曲线,在预测误差指标最优点附近搜寻最优的历史数据集样本数,根据调整后的历史数据集重新进行预测,往复进行,加快最佳历史数据集样本数的搜寻过程,直至选择最佳的历史数据集样本数目,该方案侧重于用于光伏发电功率预测的历史数据集的优化选取,提高了光伏发电功率预测精度,避免历史数据集选取粗糙,导致计算量大及干扰大的问题。
附图说明
图1表示本发明实施例1中提出的基于历史数据集时间跨度优化的光伏发电功率预测方法的流程示意图;
图2表示本发明实施例2中提出的利用长短期记忆网络法LSTM进行光伏发电预测时,预测误差指标随历史数据集的样本数变化的趋势曲线图;
图3表示本发明实施例2中提出的利用极限学习机ELM进行光伏发电预测时,预测误差指标随历史数据集的样本数变化的趋势曲线图;
图4表示本发明实施例2中提出的利用非线性自回归神经网络NARX进行光伏发电预测时,预测误差指标随历史数据集的样本数变化的趋势曲线图;
图5表示本发明实施例2中提出的利用支持向量回归SVR进行光伏发电预测时,预测误差指标随历史数据集的样本数变化的趋势曲线图;
图6表示本发明实施例3中提出的基于历史数据集时间跨度优化的光伏发电功率预测系统的结构图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好地说明本实施例,附图某些部位会有省略、放大或缩小,并不代表实际尺寸;
对于本领域技术人员来说,附图中某些公知内容说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
附图中描述位置关系的仅用于示例性说明,不能理解为对本专利的限制;
实施例1
在本实施例中,如图1所示,提出了一种基于历史数据集时间跨度优化的光伏发电功率预测方法的流程示意图,该方法包括以下步骤:
S1.确定用于光伏发电功率预测的历史功率数据来源,从历史功率数据来源中选定一定时间跨度下、具有若干数据样本数的历史数据集,并对历史数据集进行预处理;
S2.基于已预处理的历史数据集,利用光伏发电功率预测算法A进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;
S3.以P为历史数据集的数据样本数按时间跨度方向增加的间隔,将历史数据集的数据样本数增加P,利用光伏发电功率预测算法A进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;
S4.判断历史数据集的数据样本数是否达到设置值,若是,执行步骤S5;否则,返回步骤S3;
S5.形成预测误差指标随历史数据集的样本数变化的趋势曲线,确定趋势曲线中的最低点,以最低点对应的时间跨度下样本数目的历史数据集进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;
S6.以P为历史数据集的数据样本数按时间跨度方向增加的间隔,将最低点对应的时间跨度下的历史数据集的数据样本数增加P,然后进行光伏发电功率预测,判断预测误差指标是否减小,若是,将历史数据集的数据样本数增加P,执行步骤S7;否则,以H为历史数据集的数据样本数按时间跨度方向减小的间隔,将历史数据集的数据样本数减少H,H≠P,执行步骤S7;
S7.判断历史数据集的数据样本数是否达到设置值,若是,形成预测误差指标随历史数据集的样本数变化的趋势曲线,确定趋势曲线中的拐点,以拐点对应的时间跨度下样本数目的历史数据集进行光伏发电功率预测;否则,返回步骤S6。
整体上,首先确定用于光伏发电功率预测的历史功率数据来源,按时间跨度调整用于预测光伏发电功率的历史数据集的样本数据数目,在历史数据集的数据样本数设置值的限定下,获取预测误差指标随历史数据集的样本数变化的趋势曲线,在预测误差指标最优点附近搜寻最优的历史数据集样本数,根据调整后的历史数据集重新进行预测,往复进行,加快最佳历史数据集样本数的搜寻过程,直至选择最佳的历史数据集样本数目,在步骤S7中,所述的拐点即:若预测误差指标持续减小,将历史数据集样本数目继续增大,直至与前一次的预测误差指标比较,预测误差指标增大,则预测误差指标的拐点出现,拐点对应最佳历史数据集的样本数目;若预测误差指标持续增大,将历史数据集样本数目继续减少,通过光伏预测算法进行光伏发电功率预测,直至与前一次的预测误差指标比较,预测误差指标减小,则预测误差指标的拐点出现,拐点对应最佳历史数据集的样本数目。提高了光伏发电功率预测精度,避免历史数据集选取粗糙,导致计算量大及干扰大的问题。
实施例2
在本实施例中,为了考察历史数据集的时间跨度对光伏发电功率预测精度的影响,从历史功率数据来源中选定一定时间跨度下、具有若干数据样本数的历史数据集时,以历史功率数据来源对应的时间跨度为基础,自历史功率来源中选取最新近时刻开始的时间跨度下、具有若干数据样本数的数据集作为历史数据集。具体的,选取某光伏电站2018年的180天光伏发电数据作为数据来源,共计1.2万个时间点的监测数据,在本实施例中,假设1.2万个时间点的最新近的时刻为t,则以最新近时刻t开始,选取2400个时间点数据作为光伏发电功率预测的历史数据集,并进行预处理操作,预处理操作包括对历史数据集中的数据进行数据清洗,以去除历史数据集中的异常数据和干扰,还包括聚类,在聚类时,以光伏发电系统的运行工况和运行环境为聚类基础进行聚类,有利于保证后续光伏发电功率预测的精度。在步骤S3及步骤S6中,P为历史数据集的数据样本数按时间跨度方向增加的间隔,代表着宏观上为历史数据集的时间跨度进行一个变换,也即是时间跨度的变动趋势,将历史数据集的数据样本数增加P,利用光伏发电功率预测算法A进行光伏发电功率预测前,数据样本数增加后的历史数据数据集也进行预处理操作。
在本实施例中,光伏发电功率预测算法A为长短期记忆网络法LSTM或极限学习机ELM或非线性自回归神经网络NARX或支持向量回归SVR,预测误差指标选用平均绝对百分比误差MAPE,计算平均绝对百分比误差MAPE的公式为:
平均绝对百分比误差MAPE越小,光伏发电功率预测结果越好,反之,光伏发电功率预测结果越差。
比较利用长短期记忆网络法LSTM、极限学习机ELM、非线性自回归神经网络NARX、支持向量回归SVR算法进行光伏发电功率预测的预测误差指标,如图2~5所示,实线为预测误差指标MAPE,在确定趋势曲线中的最低点时,通过多项式拟合的方式将趋势曲线拟合,然后获得趋势曲线的拟合表达式,根据拟合表达式确定确定趋势曲线中的最低点,图2~图5中,虚线为多项式拟合的误差变化趋势。由图2~图5可知,随着历史数据集样本增加,预测误差指标也会发生变化,并呈现出一定的变化趋势,而预测误差在此趋势的上下波动。可见,历史数据集样本数并不是越多越好,而是有个最佳的值,使得光伏发电预测的误差最小。不同的预测算法受到历史数据集时间跨度的影响也不同,四种预测算法中,随着历史数据集样本数的增加,除了SVR误差还有持续降低的趋势外,其他三种算法都有误差降低然后变高的趋势,可见恰当地选择历史数据集,可以有效提升光伏发电预测精度。
表1为历史数据集数据样本数目长度对光伏发电功率预测误差的影响量,其中最大误差和最小误差分别为改变历史数据集长度进行预测,在此区间内可能产生的最大误差和最小误差,精度提升量为两者之差,可见通过调整历史数据集长度,有很大的预测精度提升可能。趋势线最大误差和趋势线最小误差及其精度提升量标明了通过历史数据长度的调整可以整体上提升预测精度。
表1
选用平均绝对百分比误差MAPE作为衡量光伏发电功率预测效果好坏的指标,MAPE越小,说明预测结果越好,反之则越差。整体过程分为数据预处理、搜寻MAPE变化趋势的最低点和搜寻最佳历史数据集三个步骤。数据预测主要是对历史数据进行数据清洗和归类,去除数据集中的异常数据和外界特殊干扰,聚类分析对光伏发电系统运行工况和运行环境相近的数据归集到一起进行预测。为了选取最佳的历史数据集,需要选取一定数据的数据对预测算法进行验证,作为衡量预测算法的标准,一般选用最新近的数据来进行检验。对选定的历史数据集进行光伏发电功率预测,并计算出其MAPE,然后增加历史数据集的样本数目,继续进行预测,如此循环多次,获得MAPE的变化趋势。通过曲线模拟(如高次多项式模拟)获得MAPE变化趋势的表达式,进而获得MAPE变化趋势的最低点。最佳的历史数据集样本数目在此最低点附近,因此通过比较搜索的方式来搜索最佳的历史数据集样本数。首先增大或减少历史数据集样本数,进行预测之后与上一次的预测MAPE相比较,如果MAPE减小,则继续增大或减少样本数,反之则改变历史数据集调整方向调整历史数据集,直到找到MAPE的拐点,即局部最低点,该点即为最佳历史数据样本数目点。
实施例3
如图6所示,本申请还提出了一种基于历史数据集时间跨度优化的光伏发电功率预测系统,所述系统包括:
数据预处理模块101,确定用于光伏发电功率预测的历史功率数据来源,从历史功率数据来源中选定一定时间跨度下、具有若干数据样本数的历史数据集,并对历史数据集进行预处理;
初始预测模块102,基于已预处理的历史数据集,利用光伏发电功率预测算法A进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;
变换预测模块103,以P为历史数据集的数据样本数按时间跨度方向增加的间隔,将历史数据集的数据样本数增加P,利用光伏发电功率预测算法A进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;
第一判断模块104,用于判断历史数据集的数据样本数是否达到设置值,若是,形成预测误差指标随历史数据集的样本数变化的趋势曲线,确定趋势曲线中的最低点,以最低点对应的时间跨度下样本数目的历史数据集进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;否则,在变换预测模块中以P为历史数据集的数据样本数增减变换间隔,将历史数据集的数据样本数增加P,利用光伏发电功率预测算法A进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;
预测判断模块105,以P为历史数据集的数据样本数按时间跨度方向增加的间隔,将最低点对应的时间跨度下的历史数据集的数据样本数增加P,然后进行光伏发电功率预测,判断预测误差指标是否减小,若是,将历史数据集的数据样本数增加P,输入第二判断模块;否则,以H为历史数据集的数据样本数按时间跨度方向减小的间隔,将历史数据集的数据样本数减少H,H≠P,输入第二判断模块;
第二判断模块106,判断历史数据集的数据样本数是否达到设置值,若是,形成预测误差指标随历史数据集的样本数变化的趋势曲线,确定趋势曲线中的拐点,以拐点对应的时间跨度下样本数目的历史数据集进行光伏发电功率预测;否则,返回预测判断模块。
显然,本发明的上述实施例仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (9)
1.一种基于历史数据集时间跨度优化的光伏发电功率预测方法,其特征在于,所述方法包括以下步骤:
S1.确定用于光伏发电功率预测的历史功率数据来源,从历史功率数据来源中选定一定时间跨度下、具有若干数据样本数的历史数据集,并对历史数据集进行预处理;
所述的预处理操作包括对历史数据集中的数据进行数据清洗,以去除历史数据集中的异常数据和干扰;
S2.基于已预处理的历史数据集,利用光伏发电功率预测算法A进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;
S3.以P为历史数据集的数据样本数按时间跨度方向增加的间隔,将历史数据集的数据样本数增加P,利用光伏发电功率预测算法A进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;
S4.判断历史数据集的数据样本数是否达到设置值,若是,执行步骤S5;否则,返回步骤S3;
S5.形成预测误差指标随历史数据集的样本数变化的趋势曲线,确定趋势曲线中的最低点,以最低点对应的时间跨度下样本数目的历史数据集进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;
S6.以P为历史数据集的数据样本数按时间跨度方向增加的间隔,将最低点对应的时间跨度下的历史数据集的数据样本数增加P,然后进行光伏发电功率预测,判断预测误差指标是否减小,若是,将历史数据集的数据样本数增加P,执行步骤S7;否则,以H为历史数据集的数据样本数按时间跨度方向减小的间隔,将历史数据集的数据样本数减少H,H≠P,执行步骤S7;
S7.判断历史数据集的数据样本数是否达到设置值,若是,形成预测误差指标随历史数据集的样本数变化的趋势曲线,确定趋势曲线中的拐点,以拐点对应的时间跨度下样本数目的历史数据集进行光伏发电功率预测;否则,返回步骤S6。
2.根据权利要求1所述的基于历史数据集时间跨度优化的光伏发电功率预测方法,其特征在于,在步骤S1中,从历史功率数据来源中选定一定时间跨度下、具有若干数据样本数的历史数据集时,以历史功率数据来源对应的时间跨度为基础,自历史功率来源中选取最新近时刻开始的时间跨度下、具有若干数据样本数的数据集作为历史数据集。
3.根据权利要求1所述的基于历史数据集时间跨度优化的光伏发电功率预测方法,其特征在于,所述的预处理操作还包括聚类,在聚类时,以光伏发电系统的运行工况和运行环境为聚类基础进行聚类。
4.根据权利要求3所述的基于历史数据集时间跨度优化的光伏发电功率预测方法,其特征在于,在步骤S3及步骤S6中,将历史数据集的数据样本数增加P,利用光伏发电功率预测算法A进行光伏发电功率预测前,数据样本数增加后的历史数据数据集也进行预处理操作。
5.根据权利要求1~4任意一项所述的基于历史数据集时间跨度优化的光伏发电功率预测方法,其特征在于,光伏发电功率预测算法A为长短期记忆网络法LSTM或极限学习机ELM或非线性自回归神经网络NARX或支持向量回归SVR。
7.根据权利要求6所述的基于历史数据集时间跨度优化的光伏发电功率预测方法,其特征在于,平均绝对百分比误差MAPE越小,光伏发电功率预测结果越好,反之,光伏发电功率预测结果越差。
8.根据权利要求7所述的基于历史数据集时间跨度优化的光伏发电功率预测方法,其特征在于,在步骤S5中,确定趋势曲线中的最低点时,通过多项式拟合的方式将趋势曲线拟合,然后获得趋势曲线的拟合表达式,根据拟合表达式确定趋势曲线中的最低点。
9.一种基于历史数据集时间跨度优化的光伏发电功率预测系统,其特征在于,所述系统包括:
数据预处理模块,确定用于光伏发电功率预测的历史功率数据来源,从历史功率数据来源中选定一定时间跨度下、具有若干数据样本数的历史数据集,并对历史数据集进行预处理;
所述的预处理操作包括对历史数据集中的数据进行数据清洗,以去除历史数据集中的异常数据和干扰;
初始预测模块,基于已预处理的历史数据集,利用光伏发电功率预测算法A进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;
变换预测模块,以P为历史数据集的数据样本数按时间跨度方向增加的间隔,将历史数据集的数据样本数增加P,利用光伏发电功率预测算法A进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;
第一判断模块,用于判断历史数据集的数据样本数是否达到设置值,若是,形成预测误差指标随历史数据集的样本数变化的趋势曲线,确定趋势曲线中的最低点,以最低点对应的时间跨度下样本数目的历史数据集进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;否则,在变换预测模块中以P为历史数据集的数据样本数增减变换间隔,将历史数据集的数据样本数增加P,利用光伏发电功率预测算法A进行光伏发电功率预测,并计算光伏发电功率预测结果的预测误差指标;
预测判断模块,以P为历史数据集的数据样本数按时间跨度方向增加的间隔,将最低点对应的时间跨度下的历史数据集的数据样本数增加P,然后进行光伏发电功率预测,判断预测误差指标是否减小,若是,将历史数据集的数据样本数增加P,输入第二判断模块;否则,以H为历史数据集的数据样本数按时间跨度方向减小的间隔,将历史数据集的数据样本数减少H,H≠P,输入第二判断模块;
第二判断模块,判断历史数据集的数据样本数是否达到设置值,若是,形成预测误差指标随历史数据集的样本数变化的趋势曲线,确定趋势曲线中的拐点,以拐点对应的时间跨度下样本数目的历史数据集进行光伏发电功率预测;否则,返回预测判断模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210547313.3A CN114819391B (zh) | 2022-05-19 | 2022-05-19 | 基于历史数据集时间跨度优化的光伏发电功率预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210547313.3A CN114819391B (zh) | 2022-05-19 | 2022-05-19 | 基于历史数据集时间跨度优化的光伏发电功率预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114819391A CN114819391A (zh) | 2022-07-29 |
CN114819391B true CN114819391B (zh) | 2022-12-06 |
Family
ID=82515279
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210547313.3A Active CN114819391B (zh) | 2022-05-19 | 2022-05-19 | 基于历史数据集时间跨度优化的光伏发电功率预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114819391B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116073436B (zh) * | 2023-04-06 | 2023-06-13 | 山东创宇环保科技有限公司 | 一种光伏新能源电力系统容量优化控制方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7805278B1 (en) * | 2006-11-29 | 2010-09-28 | At&T Intellectual Property Ii, Lp | Optimal sampling system on populations of collectives |
US20170140278A1 (en) * | 2015-11-18 | 2017-05-18 | Ca, Inc. | Using machine learning to predict big data environment performance |
CN106447098B (zh) * | 2016-09-22 | 2020-05-19 | 许昌许继软件技术有限公司 | 一种光伏超短期功率预测方法及装置 |
CN108921339B (zh) * | 2018-06-22 | 2021-08-10 | 南京工程学院 | 基于分位数回归的遗传支持向量机光伏功率区间预测方法 |
CN108985521A (zh) * | 2018-08-02 | 2018-12-11 | 广东工业大学 | 光伏发电系统的输出功率预测方法、装置、设备及介质 |
CN110163437B (zh) * | 2019-05-23 | 2022-05-13 | 太原理工大学 | 基于DPK-means的日前光伏发电功率预测方法 |
CN110705785A (zh) * | 2019-09-29 | 2020-01-17 | 首钢集团有限公司 | 一种连铸机结晶器热状态的监测方法及装置 |
CN111626473A (zh) * | 2020-04-17 | 2020-09-04 | 国网上海市电力公司 | 一种考虑误差修正的两阶段光伏功率预测方法 |
CN111695601B (zh) * | 2020-05-15 | 2023-06-20 | 特变电工西安电气科技有限公司 | 光伏功率预测方法、装置、设备及可读存储介质 |
US20220122103A1 (en) * | 2020-10-20 | 2022-04-21 | Zhejiang University | Customized product performance prediction method based on heterogeneous data difference compensation fusion |
CN112700043B (zh) * | 2020-12-31 | 2024-03-08 | 新奥数能科技有限公司 | 负荷预测方法、装置、计算机可读存储介质及电子设备 |
CN113919232A (zh) * | 2021-10-25 | 2022-01-11 | 北京航天创智科技有限公司 | 一种基于循环神经网络的光伏电站功率预测方法及系统 |
-
2022
- 2022-05-19 CN CN202210547313.3A patent/CN114819391B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN114819391A (zh) | 2022-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116031888B (zh) | 基于动态负荷预测的潮流优化方法、系统及存储介质 | |
CN114792156A (zh) | 基于曲线特征指标聚类的光伏输出功率预测方法和系统 | |
CN105701562B (zh) | 训练方法、所适用的预测发电功率的方法及各自系统 | |
CN114819391B (zh) | 基于历史数据集时间跨度优化的光伏发电功率预测方法及系统 | |
CN110969306A (zh) | 基于深度学习的配电低压台区负荷预测方法及装置 | |
CN110365053A (zh) | 基于延迟优化策略的短期风电功率预测方法 | |
Xue et al. | Adaptive ultra-short-term wind power prediction based on risk assessment | |
CN116821832A (zh) | 针对高压工商业用户用电负荷的异常数据辨识与修正方法 | |
CN109546648A (zh) | 一种考虑预防策略的大规模电力系统自动发电控制方法 | |
CN117878927B (zh) | 基于时序分析的电力系统负荷趋势分析方法 | |
CN117095247B (zh) | 基于数控加工的加工姿态运行优化方法、系统及介质 | |
CN109858667A (zh) | 一种基于雷电气候对负荷影响的短期负荷聚类方法 | |
CN117913808A (zh) | 一种分布式光伏发电预测方法及其装置 | |
CN111126645A (zh) | 一种基于数据挖掘技术和改进支持向量机的风电预测算法 | |
CN117587403A (zh) | 基于化学转化的铝合金模板表面处理方法及系统 | |
CN117728385A (zh) | 一种基于深度学习的电网负荷预测方法 | |
CN108123436B (zh) | 基于主成分分析和多元回归算法的电压越限预测模型 | |
CN114756722B (zh) | 一种多元数据集中管理控制系统及方法 | |
CN115809732A (zh) | 一种分布式光伏发电功率预测方法及系统 | |
CN108009686B (zh) | 一种光伏发电功率预测方法、装置及系统 | |
CN113326853A (zh) | 一种基于神经网络的工艺参数分析方法、设备以及计算机存储介质 | |
EP3460732B1 (en) | Dispatching method and system based on multiple levels of steady state production rate in working benches | |
CN113887804B (zh) | 一种基于改进局部异常因子算法的短期风电功率预测方法 | |
CN118336722B (zh) | 一种基于负荷灵敏度分析的电力系统经济调度方法 | |
CN114118499B (zh) | 一种短期风电功率预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |