CN117374972A - 一种基于Transformer的光伏短期功率区间预测方法、装置及介质 - Google Patents
一种基于Transformer的光伏短期功率区间预测方法、装置及介质 Download PDFInfo
- Publication number
- CN117374972A CN117374972A CN202311595688.8A CN202311595688A CN117374972A CN 117374972 A CN117374972 A CN 117374972A CN 202311595688 A CN202311595688 A CN 202311595688A CN 117374972 A CN117374972 A CN 117374972A
- Authority
- CN
- China
- Prior art keywords
- interval
- model
- data
- prediction
- photovoltaic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012549 training Methods 0.000 claims abstract description 97
- 238000012360 testing method Methods 0.000 claims abstract description 78
- 238000010248 power generation Methods 0.000 claims abstract description 44
- 238000011156 evaluation Methods 0.000 claims abstract description 25
- 238000012545 processing Methods 0.000 claims abstract description 17
- 238000004590 computer program Methods 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 7
- 238000012935 Averaging Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/004—Generation forecast, e.g. methods or systems for forecasting future energy generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/38—Arrangements for parallely feeding a single network by two or more generators, converters or transformers
- H02J3/381—Dispersed generators
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2300/00—Systems for supplying or distributing electric power characterised by decentralized, dispersed, or local generation
- H02J2300/20—The dispersed energy generation being of renewable origin
- H02J2300/22—The renewable source being solar energy
- H02J2300/24—The renewable source being solar energy of photovoltaic origin
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- General Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Power Engineering (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Water Supply & Treatment (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Primary Health Care (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Supply And Distribution Of Alternating Current (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于Transformer的光伏短期功率区间预测方法、装置及介质,所述方法包括:从电力系统获取光伏发电功率数据和气象数据并构造模型训练集和模型测试集;使用模型训练集对预设的Transformer模型进行训练,得到区间预测模型,将模型测试集输入区间预测模型,得到区间预测结果;根据模型训练集和模型测试集计算得到区间覆盖率、区间平均带宽和区间覆盖宽度,由此构成评价指标;由区间预测结果和评价指标共同构成光伏短期功率区间预测的最终结果。本发明提出一种基于Transformer的光伏短期功率区间预测方法、装置及介质,通过数据处理和模型训练,得到由区间预测结果及其评价指标组成的光伏短期功率区间预测的最终结果,解决预测结果的使用效能和可信度低的问题。
Description
技术领域
本发明涉及光伏发电功率预测技术领域,特别是涉及一种基于Transformer的光伏短期功率区间预测方法、装置及介质。
背景技术
随着分布式光伏的规模化建设,光伏发电不稳定的特点也逐渐受到关注,当气象条件发生变化时,光伏发电系统的电源侧会产生功率波动,对电力系统的稳定安全运行造成了不良影响,因此,光伏发电功率预测的重要性愈发凸显。根据功率预测时间尺度的不同,可以将光伏功率预测分为长期功率预测、中期功率预测和短期功率预测等,其中,光伏短期功率预测一般指对未来几分钟到数小时的光伏发电功率的预测,相较于长时间尺度的预测,可以为电网的调度管理提供更为准确且即时的功率变化信息。
在进行光伏短期功率预测时,传统的预测方法是点预测,每个时刻的预测结果是单一的数值,这类预测方法难以展现出数据存在的误差、模型导致的偏差以及预测结果的不确定性;此外,没有为预测结果提供客观的评价指标,导致预测结果的可信度低。
发明内容
本发明提供一种基于Transformer的光伏短期功率区间预测方法、装置及介质,以解决现有技术的预测结果是缺乏评价指标的单一数值,导致预测结果的使用效能和可信度低的问题。
为了解决上述问题,本发明提供了一种基于Transformer的光伏短期功率区间预测方法,包括:
从电力系统获取光伏发电功率数据和气象数据,根据所述光伏发电功率数据和气象数据构造模型训练集和模型测试集;
使用所述模型训练集,对预设的Transformer模型进行训练,得到区间预测模型,将所述模型测试集输入所述区间预测模型,得到光伏短期功率的区间预测结果;
根据所述模型训练集和模型测试集,计算得到区间覆盖率、区间平均带宽和区间覆盖宽度,由所述区间覆盖率、区间平均带宽和区间覆盖宽度构成所述区间预测结果的评价指标;
由所述区间预测结果和评价指标共同构成光伏短期功率区间预测的最终结果。
本发明使用模型训练集对Transformer模型进行训练,得到区间预测模型,能够利用大规模数据训练得到的特征来初始化Transformer模型的参数,使得到的区间预测模型的收敛速度加快、泛化能力得到提升,同时使区间预测模型拥有Transformer模型强大的计算能力和信息捕捉能力,从而提高光伏短期功率区间预测结果的准确率;根据模型训练集和模型测试集,计算得到区间预测结果的评价指标,该评价指标从三个方面进行考量,能够为区间预测结果提供客观的可信度参考标准。相比于现有技术,本发明能够提供拥有客观的评价指标的区间预测结果,解决光伏短期功率区间预测结果的使用效能和可信度低的问题。
作为优选方案,从电力系统获取光伏发电功率数据和气象数据,还包括:
删除所述光伏发电功率数据和气象数据的不合理值,其中所述不合理值包括大于第一预设值的数据、小于第二预设值的数据和重复数据;
使用删除所述不合理值后所述光伏发电功率数据和气象数据的线性值,对所述光伏发电功率数据和气象数据的缺失数据进行填充,得到第一数据;删除所述第一数据中的夜间数据,将删除所述夜间数据后的第一数据进行归一化处理。
本优选方案通过删除大于第一预设值的数据和小于第二预设值的数据,可以减少极端值对整体数据的影响,从而更好地反映数据的整体趋势和分布情况,删除重复数据可以去除数据中冗余的信息,提高数据的利用率;使用线性值来填充缺失数据,不会改变数据的分布,并且能够让数据更完整,有利于进行数据统计分析和计算;由于不同特征数据可能存在不同的范围,将其归一化处理后,能够使数据处于一个相同的范围,使计算机更容易处理,并且可以为模型提供清晰的特征权重反应,有利于提升模型表现。
作为优选方案,使用所述模型训练集,对预设的Transformer模型进行训练,得到区间预测模型,将所述模型测试集输入所述区间预测模型,得到光伏短期功率的区间预测结果,具体为:
使用所述模型训练集,从所述Transformer模型的置信区间下限直至置信区间上限,按预设步长对所述Transformer模型进行训练,得到所述区间预测模型;其中所述区间预测模型包括依次连接的Transformer网络和上下区间预测网络;
将所述模型测试集输入所述区间预测模型,使用所述Transformer网络对所述模型测试集进行特征提取;使用所述上下区间预测网络对提取后的特征进行分析,输出光伏短期功率区间上下界的预测值,得到所述区间预测结果。
本优选方案使用模型训练集对Transformer模型进行训练,得到区间预测模型,能够利用大规模数据训练得到的特征来初始化Transformer模型的参数,使区间预测模型的收敛速度加快,提高区间预测模型的泛化能力,从而提高光伏短期功率区间预测结果的准确率。
作为优选方案,根据所述模型训练集和模型测试集,计算得到区间覆盖率,具体为:
通过确定所述区间预测结果的下界和上界来确定布尔量,根据所述布尔量,以及所述模型训练集和模型测试集的样本数量计算得到所述区间覆盖率;
所述区间覆盖率为:
对于参数有:
其中,为所述样本数量,/>和/>分别为所述区间预测结果的下界和上界;/>为布尔量,其值由实际值/>决定,所述实际值/>为所述模型训练集和模型测试集中数据的真实值。
本优选方案所构建的区间覆盖率表示实际值落在预测区间上下界的比率,用来评价区间预测结果的可靠性,能够为本方案得到的区间预测结果提供客观的可信度作为参考。
作为优选方案,根据所述模型训练集和模型测试集,计算得到区间平均带宽,具体为:
通过确定所述区间预测结果的下界和上界,结合所述模型训练集和模型测试集中数据的真实值得到所述区间平均带宽;
所述区间平均带宽为:
其中,为所述模型训练集和模型测试集的样本数量,/>和/>分别为所述区间预测结果的下界和上界;/>和/>分别为实际值/>的最大值和最小值,所述实际值/>为所述模型训练集和模型测试集中数据的真实值。
本优选方案所构建的区间平均带宽能够反应区间预测结果的清晰度,进而避免因单纯追求可靠性,出现预测区间过宽,不能给出有效的预测值不确定性信息,失去决策价值的情况。
作为优选方案,根据所述模型训练集和模型测试集,计算得到区间覆盖宽度,具体为:
使用所述区间覆盖率与预设的置信率进行大小比较,根据进行所述大小比较后得到的结果,结合所述区间平均带宽,计算得到所述区间覆盖宽度;所述区间覆盖宽度为:
对于中间参数有:
其中,为所述置信率,/>为预设的惩罚参数,/>为自然常数,/>为所述区间覆盖率,/>为所述区间平均带宽。
本优选方案所构建的区间覆盖宽度是综合区间覆盖率和区间平均带宽得到的综合指标,当区间覆盖率小于给定的置信率时,给予指数级的惩罚,当覆盖率大于置信率时,只考虑区间平均宽度,综合指标/>值越小,代表光伏短期功率区间的区间预测结果越好。
本发明还提供了一种基于Transformer的光伏短期功率区间预测装置,包括:
数据处理模块,用于从电力系统获取光伏发电功率数据和气象数据,根据所述光伏发电功率数据和气象数据构造模型训练集和模型测试集;
区间预测模块,用于使用所述模型训练集,对预设的Transformer模型进行训练,得到区间预测模型,将所述模型测试集输入所述区间预测模型,得到光伏短期功率的区间预测结果;
指标构建模块,用于根据所述模型训练集和模型测试集,计算得到区间覆盖率、区间平均带宽和区间覆盖宽度,由所述区间覆盖率、区间平均带宽和区间覆盖宽度构成所述区间预测结果的评价指标;
结果输出模块,用于由所述区间预测结果和评价指标共同构成光伏短期功率区间预测的最终结果。
作为优选方案,所述数据处理模块还包括:
删除所述光伏发电功率数据和气象数据的不合理值,其中所述不合理值包括大于第一预设值的数据、小于第二预设值的数据和重复数据;
使用删除所述不合理值后所述光伏发电功率数据和气象数据的线性值,对所述光伏发电功率数据和气象数据的缺失数据进行填充,得到第一数据;删除所述第一数据中的夜间数据,将删除所述夜间数据后的第一数据进行归一化处理。
作为优选方案,所述区间预测模块具体为:
使用所述模型训练集,从所述Transformer模型的置信区间下限直至置信区间上限,按预设步长对所述Transformer模型进行训练,得到所述区间预测模型;其中所述区间预测模型包括依次连接的Transformer网络和上下区间预测网络;
将所述模型测试集输入所述区间预测模型,使用所述Transformer网络对所述模型测试集进行特征提取;使用所述上下区间预测网络对提取后的特征进行分析,输出光伏短期功率区间上下界的预测值,得到所述区间预测结果。
作为优选方案,所述指标构建模块还包括:
区间覆盖率单元,用于通过确定所述区间预测结果的下界和上界来确定布尔量,根据所述布尔量,以及所述模型训练集和模型测试集的样本数量计算得到所述区间覆盖率;
所述区间覆盖率为:
对于参数有:
其中,为所述样本数量,/>和/>分别为所述区间预测结果的下界和上界;/>为布尔量,其值由实际值/>决定,所述实际值/>为所述模型训练集和模型测试集中数据的真实值;
区间平均带宽单元,用于通过确定所述区间预测结果的下界和上界,结合所述模型训练集和模型测试集中数据的真实值得到所述区间平均带宽;
所述区间平均带宽为:
其中,为所述模型训练集和模型测试集的样本数量,/>和/>分别为所述区间预测结果的下界和上界;/>和/>分别为实际值/>的最大值和最小值,所述实际值/>为所述模型训练集和模型测试集中数据的真实值;
区间覆盖宽度单元,用于使用所述区间覆盖率与预设的置信率进行大小比较,根据进行所述大小比较后得到的结果,结合所述区间平均带宽,计算得到所述区间覆盖宽度;所述区间覆盖宽度为:
对于中间参数有:
其中,为所述置信率,/>为预设的惩罚参数,/>为自然常数,/>为所述区间覆盖率,/>为所述区间平均带宽。
本发明还提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被计算机调用并执行,实现如上所述一种基于Transformer的光伏短期功率区间预测方法。
附图说明
图1是本发明实施例提供的一种基于Transformer的光伏短期功率区间预测方法的流程示意图;
图2是本发明实施例提供的基于Transformer的光伏短期功率区间预测结果的系统流程图;
图3是本发明实施例提供的一种基于Transformer的光伏短期功率区间预测装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。
请参阅图1,本发明的实施例提供了一种基于Transformer的光伏短期功率区间预测方法,包括S1~S4:
S1、从电力系统获取光伏发电功率数据和气象数据,根据光伏发电功率数据和气象数据构造模型训练集和模型测试集。
在本发明实施例中,S1包括S1.1~S1.3:
S1.1、从电力系统获取光伏发电功率数据和气象数据;其中,气象数据包括:太阳辐照度、环境温度、相对湿度、气压、风速、风向和光伏组件温度。
需要说明的是,用于短期功率预测的光伏发电功率数据和气象数据通常是预测目标时间点之前几分钟到数小时的数据,其时间范围可以由技术人员来自主选择。但是,如果仅使用之前数分钟的数据,可能由于数据量太少导致预测结果不够准确;如果使用太长时间范围内的数据,导致使用的数据过多,可能会输入多余参数降低计算效率。因此,对于光伏发电功率数据和气象数据而言,获取的数据量应该由技术人员做一定的前期测试,以保证其合理性。
S1.2、删除光伏发电功率数据和气象数据的不合理值,其中不合理值包括大于第一预设值的数据、小于第二预设值的数据和重复数据;
使用删除不合理值后光伏发电功率数据和气象数据的线性值,对光伏发电功率数据和气象数据的缺失数据进行填充,得到第一数据;删除第一数据中的夜间数据,将删除夜间数据后的第一数据进行归一化处理,得到处理后的光伏发电功率数据和气象数据。
需要说明的是,对于夜间数据而言,夜间光伏不发电的时间段所处地理经纬度不同、季节不同、光伏板安装方式不同等因素,导致不同地区的夜间数据可能存在差异,所以夜间数据的具体选取时间范围需要由技术人员进行判断选择,或者编写程序进行筛选。
S1.3、根据光伏发电功率数据和气象数据构造模型训练集和模型测试集。
本实施例通过删除大于第一预设值的数据和小于第二预设值的数据,可以减少极端值对整体数据的影响,从而更好地反映数据的整体趋势和分布情况,删除重复数据可以去除数据中冗余的信息,提高数据的利用率;使用线性值来填充缺失数据,不会改变数据的分布,并且能够让数据更完整,有利于进行数据统计分析和计算;由于夜间光伏发电功率为零,因此可以通过删除夜间数据来简化后续的计算;由于不同特征数据可能存在不同的范围,将其归一化处理后,能够使数据处于一个相同的范围,使得计算机更容易处理,并且可以为模型提供清晰的特征权重反应,有利于提升模型表现。
S2、使用模型训练集,对预设的Transformer模型进行训练,得到区间预测模型,将模型测试集输入区间预测模型,得到光伏短期功率的区间预测结果。
在本发明实施例中,使用模型训练集,从Transformer模型的置信区间下限直至置信区间上限,按预设步长对Transformer模型进行训练,得到区间预测模型;其中区间预测模型包括依次连接的Transformer网络和上下区间预测网络;
将模型测试集输入区间预测模型,使用Transformer网络对模型测试集进行特征提取;使用上下区间预测网络对提取后的特征进行分析,输出光伏短期功率区间上下界的预测值,得到区间预测结果。
其中,Transformer模型是一种基于注意力机制的神经网络架构。与传统的循环神经网络(RNN)和卷积神经网络(CNN)相比,Transformer模型处理变长序列数据的能力更强、有更好的并行能力和性能。
参阅图2,为应用本发明实施例,提供了基于Transformer的光伏短期功率区间预测结果的系统流程图。图中共包含n个分位数预测单元,每个单元均包含一个完整且独立的Transformer结构;所有分位数预测单元的结果共同组成了区间预测结果。不同于RNN网络的时序串行结构,本系统流程图中各个编码和解码环节是多对多结构,因此本实施例的Transformer网络拥有并行计算的能力,相比传统的RNN网络可以有效地提高计算效率,能够更好地对模型测试集进行数据的特征提取。
本实施例使用模型训练集对Transformer模型进行训练,得到区间预测模型,能够利用大规模数据训练得到的特征来初始化Transformer模型的参数,使区间预测模型的收敛速度加快,提高区间预测模型的泛化能力,从而提高光伏短期功率区间预测结果的准确率。
S3、根据模型训练集和模型测试集,计算得到区间覆盖率、区间平均带宽和区间覆盖宽度,由区间覆盖率、区间平均带宽和区间覆盖宽度构成区间预测结果的评价指标。
在本发明实施例中,S3包括S3.1~S3.4:
S3.1、通过确定区间预测结果的下界和上界来确定布尔量,根据布尔量,以及模型训练集和模型测试集的样本数量计算得到区间覆盖率;
区间覆盖率为:
对于参数有:
其中,为样本数量,/>和/>分别为区间预测结果的下界和上界;/>为布尔量,其值由实际值/>决定,实际值/>为模型训练集和模型测试集中数据的真实值。
本实施例所构建的区间覆盖率表示实际值落在预测区间上下界的比率,用来评价区间预测结果的可靠性,能够为本方案得到的区间预测结果提供客观的可信度作为参考。
S3.2、通过确定区间预测结果的下界和上界,结合模型训练集和模型测试集中数据的真实值得到区间平均带宽;
区间平均带宽为:
其中,为模型训练集和模型测试集的样本数量,/>和/>分别为区间预测结果的下界和上界;/>和/>分别为实际值/>的最大值和最小值,实际值/>为模型训练集和模型测试集中数据的真实值。
本实施例所构建的区间平均带宽能够反应区间预测结果的清晰度(狭窄程度),进而避免因单纯追求可靠性,出现预测区间过宽,不能给出有效的预测值不确定性信息,失去决策价值的情况。
S3.3、使用区间覆盖率与预设的置信率进行大小比较,根据进行大小比较后得到的结果,结合区间平均带宽,计算得到区间覆盖宽度;区间覆盖宽度为:
对于中间参数有:
其中,为置信率,/>为自然常数,/>为区间覆盖率,/>为区间平均带宽;/>为预设的惩罚参数,/>。
本实施例所构建的区间覆盖宽度是综合区间覆盖率和区间平均带宽得到的综合指标,当区间覆盖率小于给定的置信率时,给予指数级的惩罚,当覆盖率大于置信率时,只考虑区间平均宽度,综合指标/>值越小,代表光伏短期功率区间的区间预测结果越好。
S3.4、由区间覆盖率、区间平均带宽和区间覆盖宽度构成区间预测结果的评价指标。
S4、由区间预测结果和评价指标共同构成光伏短期功率区间预测的最终结果。
总体看来,本发明实施例具有以下有益效果:
通过对获取的光伏发电功率数据和气象数据进行处理,能够减少极端值对整体数据的影响、去除数据中冗余的信息、能够让数据更完整、简化后续的计算以及提升模型表现。把处理后的数据集分为模型训练集和模型测试集,使用训练集来训练Transformer模型以得到区间预测模型,能够利用大规模数据训练得到的特征来初始化Transformer模型的参数,使区间预测模型的收敛速度加快,提高区间预测模型的泛化能力;并使用模型训练集和模型测试集来评估区间预测结果在数据上的性能,得到由区间覆盖率、区间平均带宽和区间覆盖宽度构成区间预测结果的评价指标,通过评价指标可以综合了解区间预测结果的可信度。
请参阅图3,本发明的一个实施例提供了一种基于Transformer的光伏短期功率区间预测装置,包括:
数据处理模块10,用于从电力系统获取光伏发电功率数据和气象数据,根据光伏发电功率数据和气象数据构造模型训练集和模型测试集;
区间预测模块20,用于使用模型训练集,对预设的Transformer模型进行训练,得到区间预测模型,将模型测试集输入区间预测模型,得到光伏短期功率的区间预测结果;
指标构建模块30,用于根据模型训练集和模型测试集,计算得到区间覆盖率、区间平均带宽和区间覆盖宽度,由区间覆盖率、区间平均带宽和区间覆盖宽度构成区间预测结果的评价指标;
结果输出模块40,用于由区间预测结果和评价指标共同构成光伏短期功率区间预测的最终结果。
在一个实施例中,数据处理模块10还用于:
删除光伏发电功率数据和气象数据的不合理值,其中不合理值包括大于第一预设值的数据、小于第二预设值的数据和重复数据;
使用删除不合理值后光伏发电功率数据和气象数据的线性值,对光伏发电功率数据和气象数据的缺失数据进行填充,得到第一数据;删除第一数据中的夜间数据,将删除夜间数据后的第一数据进行归一化处理。
在一个实施例中,区间预测模块20还用于:
使用模型训练集,从Transformer模型的置信区间下限直至置信区间上限,按预设步长对Transformer模型进行训练,得到区间预测模型;其中区间预测模型包括依次连接的Transformer网络和上下区间预测网络;
将模型测试集输入区间预测模型,使用Transformer网络对模型测试集进行特征提取;使用上下区间预测网络对提取后的特征进行分析,输出光伏短期功率区间上下界的预测值,得到区间预测结果。
在一个实施例中,指标构建模块30还包括:
区间覆盖率单元,用于通过确定区间预测结果的下界和上界来确定布尔量,根据布尔量,以及模型训练集和模型测试集的样本数量计算得到区间覆盖率;
区间覆盖率为:
对于参数有:
其中,为样本数量,/>和/>分别为区间预测结果的下界和上界;/>为布尔量,其值由实际值/>决定,实际值/>为模型训练集和模型测试集中数据的真实值;
区间平均带宽单元,用于通过确定区间预测结果的下界和上界,结合模型训练集和模型测试集中数据的真实值得到区间平均带宽;
区间平均带宽为:
其中,为模型训练集和模型测试集的样本数量,/>和/>分别为区间预测结果的下界和上界;/>和/>分别为实际值/>的最大值和最小值,实际值/>为模型训练集和模型测试集中数据的真实值;
区间覆盖宽度单元,用于使用区间覆盖率与预设的置信率进行大小比较,根据进行大小比较后得到的结果,结合区间平均带宽,计算得到区间覆盖宽度;区间覆盖宽度为:
对于中间参数有:
其中,为置信率,/>为预设的惩罚参数,/>为自然常数,/>为区间覆盖率,为区间平均带宽。
本装置使用模型训练集对Transformer模型进行训练,得到区间预测模型,能够利用大规模数据训练得到的特征来初始化Transformer模型的参数,使得到的区间预测模型的收敛速度加快、泛化能力得到提升,同时使区间预测模型拥有Transformer模型强大的计算能力和信息捕捉能力,从而提高光伏短期功率区间预测结果的准确率;根据模型训练集和模型测试集,计算得到区间预测结果的评价指标,该评价指标从三个方面进行考量,能够为区间预测结果提供客观的可信度参考标准。
相应的,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行一种基于Transformer的光伏短期功率区间预测方法;
其中,一种基于Transformer的光伏短期功率区间预测方法如果以软件功能单元的形式实现并作为独立的产品使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。
以上是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (11)
1.一种基于Transformer的光伏短期功率区间预测方法,其特征在于,包括:
从电力系统获取光伏发电功率数据和气象数据,根据所述光伏发电功率数据和气象数据构造模型训练集和模型测试集;
使用所述模型训练集,对预设的Transformer模型进行训练,得到区间预测模型,将所述模型测试集输入所述区间预测模型,得到光伏短期功率的区间预测结果;
根据所述模型训练集和模型测试集,计算得到区间覆盖率、区间平均带宽和区间覆盖宽度,由所述区间覆盖率、区间平均带宽和区间覆盖宽度构成所述区间预测结果的评价指标;
由所述区间预测结果和评价指标共同构成光伏短期功率区间预测的最终结果。
2.如权利要求1所述的一种基于Transformer的光伏短期功率区间预测方法,其特征在于,从电力系统获取光伏发电功率数据和气象数据,还包括:
删除所述光伏发电功率数据和气象数据的不合理值,其中所述不合理值包括大于第一预设值的数据、小于第二预设值的数据和重复数据;
使用删除所述不合理值后所述光伏发电功率数据和气象数据的线性值,对所述光伏发电功率数据和气象数据的缺失数据进行填充,得到第一数据;删除所述第一数据中的夜间数据,将删除所述夜间数据后的第一数据进行归一化处理。
3.如权利要求1所述的一种基于Transformer的光伏短期功率区间预测方法,其特征在于,使用所述模型训练集,对预设的Transformer模型进行训练,得到区间预测模型,将所述模型测试集输入所述区间预测模型,得到光伏短期功率的区间预测结果,具体为:
使用所述模型训练集,从所述Transformer模型的置信区间下限直至置信区间上限,按预设步长对所述Transformer模型进行训练,得到所述区间预测模型;其中所述区间预测模型包括依次连接的Transformer网络和上下区间预测网络;
将所述模型测试集输入所述区间预测模型,使用所述Transformer网络对所述模型测试集进行特征提取;使用所述上下区间预测网络对提取后的特征进行分析,输出光伏短期功率区间上下界的预测值,得到所述区间预测结果。
4.如权利要求1所述的一种基于Transformer的光伏短期功率区间预测方法,其特征在于,根据所述模型训练集和模型测试集,计算得到区间覆盖率,具体为:
通过确定所述区间预测结果的下界和上界来确定布尔量,根据所述布尔量,以及所述模型训练集和模型测试集的样本数量计算得到所述区间覆盖率;
所述区间覆盖率为:
对于参数有:
其中,为所述样本数量,/>和/>分别为所述区间预测结果的下界和上界;/>为布尔量,其值由实际值/>决定,所述实际值/>为所述模型训练集和模型测试集中数据的真实值。
5.如权利要求1所述的一种基于Transformer的光伏短期功率区间预测方法,其特征在于,根据所述模型训练集和模型测试集,计算得到区间平均带宽,具体为:
通过确定所述区间预测结果的下界和上界,结合所述模型训练集和模型测试集中数据的真实值得到所述区间平均带宽;
所述区间平均带宽为:
其中,为所述模型训练集和模型测试集的样本数量,/>和/>分别为所述区间预测结果的下界和上界;/>和/>分别为实际值/>的最大值和最小值,所述实际值/>为所述模型训练集和模型测试集中数据的真实值。
6.如权利要求1所述的一种基于Transformer的光伏短期功率区间预测方法,其特征在于,根据所述模型训练集和模型测试集,计算得到区间覆盖宽度,具体为:
使用所述区间覆盖率与预设的置信率进行大小比较,根据进行所述大小比较后得到的结果,结合所述区间平均带宽,计算得到所述区间覆盖宽度;所述区间覆盖宽度为:
对于中间参数有:
其中,为所述置信率,/>为预设的惩罚参数,/>为自然常数,/>为所述区间覆盖率,为所述区间平均带宽。
7.一种基于Transformer的光伏短期功率区间预测装置,其特征在于,包括:
数据处理模块,用于从电力系统获取光伏发电功率数据和气象数据,根据所述光伏发电功率数据和气象数据构造模型训练集和模型测试集;
区间预测模块,用于使用所述模型训练集,对预设的Transformer模型进行训练,得到区间预测模型,将所述模型测试集输入所述区间预测模型,得到光伏短期功率的区间预测结果;
指标构建模块,用于根据所述模型训练集和模型测试集,计算得到区间覆盖率、区间平均带宽和区间覆盖宽度,由所述区间覆盖率、区间平均带宽和区间覆盖宽度构成所述区间预测结果的评价指标;
结果输出模块,用于由所述区间预测结果和评价指标共同构成光伏短期功率区间预测的最终结果。
8.如权利要求7所述的一种基于Transformer的光伏短期功率区间预测装置,其特征在于,所述数据处理模块还包括:
删除所述光伏发电功率数据和气象数据的不合理值,其中所述不合理值包括大于第一预设值的数据、小于第二预设值的数据和重复数据;
使用删除所述不合理值后所述光伏发电功率数据和气象数据的线性值,对所述光伏发电功率数据和气象数据的缺失数据进行填充,得到第一数据;删除所述第一数据中的夜间数据,将删除所述夜间数据后的第一数据进行归一化处理。
9.如权利要求7所述的一种基于Transformer的光伏短期功率区间预测装置,其特征在于,所述区间预测模块具体为:
使用所述模型训练集,从所述Transformer模型的置信区间下限直至置信区间上限,按预设步长对所述Transformer模型进行训练,得到所述区间预测模型;其中所述区间预测模型包括依次连接的Transformer网络和上下区间预测网络;
将所述模型测试集输入所述区间预测模型,使用所述Transformer网络对所述模型测试集进行特征提取;使用所述上下区间预测网络对提取后的特征进行分析,输出光伏短期功率区间上下界的预测值,得到所述区间预测结果。
10.如权利要求7所述的一种基于Transformer的光伏短期功率区间预测装置,其特征在于,所述指标构建模块还包括:
区间覆盖率单元,用于通过确定所述区间预测结果的下界和上界来确定布尔量,根据所述布尔量,以及所述模型训练集和模型测试集的样本数量计算得到所述区间覆盖率;
所述区间覆盖率为:
对于参数有:
其中,为所述样本数量,/>和/>分别为所述区间预测结果的下界和上界;/>为布尔量,其值由实际值/>决定,所述实际值/>为所述模型训练集和模型测试集中数据的真实值;
区间平均带宽单元,用于通过确定所述区间预测结果的下界和上界,结合所述模型训练集和模型测试集中数据的真实值得到所述区间平均带宽;
所述区间平均带宽为:
其中,为所述模型训练集和模型测试集的样本数量,/>和/>分别为所述区间预测结果的下界和上界;/>和/>分别为实际值/>的最大值和最小值,所述实际值/>为所述模型训练集和模型测试集中数据的真实值;
区间覆盖宽度单元,用于使用所述区间覆盖率与预设的置信率进行大小比较,根据进行所述大小比较后得到的结果,结合所述区间平均带宽,计算得到所述区间覆盖宽度;所述区间覆盖宽度为:
对于中间参数有:
其中,为所述置信率,/>为预设的惩罚参数,/>为自然常数,/>为所述区间覆盖率,为所述区间平均带宽。
11.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被计算机调用并执行,实现如上述权利要求1至6任意一种基于Transformer的光伏短期功率区间预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311595688.8A CN117374972A (zh) | 2023-11-28 | 2023-11-28 | 一种基于Transformer的光伏短期功率区间预测方法、装置及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311595688.8A CN117374972A (zh) | 2023-11-28 | 2023-11-28 | 一种基于Transformer的光伏短期功率区间预测方法、装置及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117374972A true CN117374972A (zh) | 2024-01-09 |
Family
ID=89396832
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311595688.8A Pending CN117374972A (zh) | 2023-11-28 | 2023-11-28 | 一种基于Transformer的光伏短期功率区间预测方法、装置及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117374972A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112991090A (zh) * | 2021-02-05 | 2021-06-18 | 江南大学 | 基于Transformer模型的光伏功率预测方法 |
US11070056B1 (en) * | 2020-03-13 | 2021-07-20 | Dalian University Of Technology | Short-term interval prediction method for photovoltaic power output |
CN115222138A (zh) * | 2022-07-28 | 2022-10-21 | 国网浙江省电力有限公司嘉兴供电公司 | 一种基于eemd-lstm微网光伏短期功率区间预测方法 |
CN115935809A (zh) * | 2022-11-25 | 2023-04-07 | 国网上海市电力公司 | 一种基于地基云图云量特征的光伏发电功率区间预测方法 |
CN116937541A (zh) * | 2023-06-19 | 2023-10-24 | 中国科学院广州能源研究所 | 基于CNN-GRU-Attention的光伏短期功率区间预测方法及相关设备 |
-
2023
- 2023-11-28 CN CN202311595688.8A patent/CN117374972A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11070056B1 (en) * | 2020-03-13 | 2021-07-20 | Dalian University Of Technology | Short-term interval prediction method for photovoltaic power output |
CN112991090A (zh) * | 2021-02-05 | 2021-06-18 | 江南大学 | 基于Transformer模型的光伏功率预测方法 |
CN115222138A (zh) * | 2022-07-28 | 2022-10-21 | 国网浙江省电力有限公司嘉兴供电公司 | 一种基于eemd-lstm微网光伏短期功率区间预测方法 |
CN115935809A (zh) * | 2022-11-25 | 2023-04-07 | 国网上海市电力公司 | 一种基于地基云图云量特征的光伏发电功率区间预测方法 |
CN116937541A (zh) * | 2023-06-19 | 2023-10-24 | 中国科学院广州能源研究所 | 基于CNN-GRU-Attention的光伏短期功率区间预测方法及相关设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110427654B (zh) | 一种基于敏感状态的滑坡预测模型构建方法及系统 | |
CN115987295B (zh) | 基于物联网的农作物监控数据高效处理方法 | |
CN112035448A (zh) | 一种综合地基gnss水汽和气象要素的神经网络短临降水预报方法 | |
CN116431975A (zh) | 一种数据中心的环境监测方法及系统 | |
CN111861023A (zh) | 基于统计学的混合风电功率预测方法、装置 | |
Ashkboos et al. | Ens-10: A dataset for post-processing ensemble weather forecasts | |
CN115689055A (zh) | 一种短期太阳辐照度预测方法及装置 | |
CN115329930A (zh) | 一种基于混合深度学习模型的洪水过程概率预报方法 | |
CN115034485A (zh) | 一种基于数据空间的风电功率区间预测方法及装置 | |
CN117526274A (zh) | 极端气候下新能源功率预测方法、电子设备和存储介质 | |
Chen et al. | Generative machine learning methods for multivariate ensemble postprocessing | |
CN114357737A (zh) | 针对大尺度水文模型时变参数的代理优化率定方法 | |
CN111950752A (zh) | 光伏电站发电量预测方法、装置、系统及其存储介质 | |
CN117374972A (zh) | 一种基于Transformer的光伏短期功率区间预测方法、装置及介质 | |
CN116739172A (zh) | 一种基于爬坡识别的海上风电功率超短期预测方法及装置 | |
CN116307139A (zh) | 一种优化与改进极限学习机的风电功率超短期预测方法 | |
CN114691661B (zh) | 一种基于同化的云导风、温湿廓线预处理分析方法及系统 | |
CN115907228A (zh) | 一种基于pso-lssvm的短期电力负荷预测分析方法 | |
CN114564487A (zh) | 预报预测相结合的气象栅格数据更新方法 | |
CN115310648A (zh) | 一种基于多气象变量模型识别的中长期风电功率组合预测方法 | |
CN114389953A (zh) | 一种基于流量预测的Kubernetes容器动态扩缩容方法及系统 | |
CN111382147A (zh) | 一种气象数据缺失插补方法和系统 | |
CN117350180B (zh) | 一种复杂工况下洪水快速预测模型集合构建方法 | |
CN116611588B (zh) | 降水多驱动因子分段率定优化预报方法及系统 | |
CN113722970B (zh) | 一种光伏功率超短期在线预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |