CN113988477A - 基于机器学习的光伏功率短期预测方法、装置及存储介质 - Google Patents

基于机器学习的光伏功率短期预测方法、装置及存储介质 Download PDF

Info

Publication number
CN113988477A
CN113988477A CN202111425357.0A CN202111425357A CN113988477A CN 113988477 A CN113988477 A CN 113988477A CN 202111425357 A CN202111425357 A CN 202111425357A CN 113988477 A CN113988477 A CN 113988477A
Authority
CN
China
Prior art keywords
data
term
prediction
trend
photovoltaic power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111425357.0A
Other languages
English (en)
Inventor
王晓妮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xi'an Huaqi Data Technology Co ltd
Original Assignee
Xi'an Huaqi Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xi'an Huaqi Data Technology Co ltd filed Critical Xi'an Huaqi Data Technology Co ltd
Priority to CN202111425357.0A priority Critical patent/CN113988477A/zh
Publication of CN113988477A publication Critical patent/CN113988477A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Photovoltaic Devices (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明涉及基于机器学习的光伏功率短期预测方法、装置及存储介质,该方法包括历史数据整合、数据集预处理、时序趋势分解、最优特征筛选、机器学习建模和预测趋势融合等步骤。其采用趋势分解与机器学习算法实现对光伏电站一定时空尺度下的多维度数据进行整合清洗,然后使用时序数据趋势分解法进行功率数据的趋势分解,并对比使用多种机器学习回归算法和自回归模型进行各趋势项的建模预测,最后结合分解模型对预测结果进行趋势预测融合,完成光伏功率的短期预测。本发明对功率数据分解后的各趋势项分别建模,有效提高预测精度,为新能源场站业主带来更精准的功率预测和更大的收益空间,助力新能源的科学规划与合理应用。

Description

基于机器学习的光伏功率短期预测方法、装置及存储介质
技术领域
本发明属于电网光伏发电预测技术领域,更具体地,涉及一种基于机器学习的光伏功率短期预测方法、装置及存储介质。
背景技术
在新能源补贴退坡、平价时代即将到来之际,新能源场站业主面临的挑战更加严峻,一面是补贴减少带来的直观经济收益差异,一面是严格的考核给场站带来的经济负担。只有持续不断地优化预测技术和服务水平,提升预测精度,才能真正减少考核,为场站带来更大的收益空间。
目前我国关于功率预测与控制技术的标准相对陈旧,多采用传统的物理和统计方法,物理方法基于太阳辐照传递方程、光伏组件运行方程等物理方程进行预测,需要光伏电站详细的地理信息以及气象和太阳辐照数据,不需要大量的历史数据,建模过程复杂,且难以模拟一些极端异常天气情况和光伏组件参数随时间发生的缓慢变化的情况,模型抗干扰能力较差,鲁棒性不强。对采集数据和预测数据多项指标的要求规范还不够细致和具体,在应对新能源快速规模化并网,解决新能源消纳,平衡新能源波动等问题,亟待需要进行标准更新,以适应新能源的快速发展。
综上,亟待开发一种精准的光伏功率预测技术,用以直接助力新能源的科学规划与合理应用。
发明内容
本申请提供一种基于机器学习的光伏功率短期预测方法、装置及存储介质,解决现有技术在短期条件下,光伏功率预测准确度不够的技术问题。
为了达到上述目的,本发明的技术方案如下:
第一个方面,本发明实施例提供一种基于机器学习的光伏功率短期预测方法,包括:
历史数据整合:从光伏电站一定时空尺度下收集数据,并以时间作为索引将它们整合为时间序列数据;
数据集预处理:将数据中连续取值的特征进行分箱处理,并进行缺失值和异常值的数据清洗;
时序趋势分解:利用趋势分解法将光伏历史功率的时序数据进行趋势分解,将其分解为长期趋势项、季节变动项、循环变动项和随机波动项;
最优特征筛选:使用基于岭回归的递归特征消除方法进行最优特征筛选;
机器学习建模:分别对长期趋势项、季节变动项、循环变动项建立机器学习回归预测模型,使用均方误差指标进行模型效果的评估;对随机波动项使用自回归模型拟合并进行白噪声检验;
预测趋势融合:对模型预测结果进行趋势融合,完成光伏功率的短期预测。
第二个方面,本发明实施例提供一种基于机器学习的光伏功率短期预测装置,包括:
历史数据整合模块,用于从光伏电站一定时空尺度下收集数据,并以时间作为索引将它们整合为时间序列数据;
数据集预处理模块,用于将数据中连续取值的特征进行分箱处理,并进行缺失值和异常值的数据清洗;
时序趋势分解模块,用于利用趋势分解法将光伏历史功率的时序数据进行趋势分解,将其分解为长期趋势项、季节变动项、循环变动项和随机波动项;
最优特征筛选模块,用于使用基于岭回归的递归特征消除方法进行最优特征筛选;
机器学习建模模块,用于分别对长期趋势项、季节变动项、循环变动项建立机器学习回归预测模型,使用均方误差指标进行模型效果的评估;对随机波动项使用自回归模型拟合并进行白噪声检验;
预测趋势融合模块,用于对模型预测结果进行趋势融合,完成光伏功率的短期预测。
第三个方面,本发明实施例提供一种基于机器学习的光伏功率短期预测的电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的方法的步骤。
第四个方面,本发明实施例提供一种基于机器学习的光伏功率短期预测的存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。
本发明的有益效果如下:
1.本发明采用趋势分解与机器学习算法实现对光伏电站一定时空尺度下的多维度数据进行整合清洗,然后使用时序数据趋势分解法进行功率数据的趋势分解,并对比使用多种机器学习回归算法和自回归模型进行各趋势项的建模预测,最后结合分解模型对预测结果进行趋势预测融合,完成光伏功率的短期预测。
2.与传统的物理和统计方法相比,本发明:1)对功率数据分解后的各趋势项分别建模,有效提高预测精度;2)为新能源场站业主带来更精准的功率预测和更大的收益空间;3)更好的适应新能源快速发展,直接助力新能源的科学规划与合理应用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一种实施例的整体流程示意图;
图2是本发明一种实施例的趋势分解与机器学习建模的流程示意图;
图3是本发明一种实施例的装置示意图;
图4是本发明一种实施例的电子设备的实体结构示意图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。而本申请所说“连接”、“联接”,如无特别说明,均包括直接和间接连接(联接)。
本发明的目的是提供基于趋势分解与机器学习的光伏功率短期(6小时-1天)预测方法,基于光伏电站一定时空尺度下的历史功率、气候、气象、地理位置、电站设计、电气效率、管理运营等数据,首先进行数据整合与清洗,然后通过时序分析算法对光伏电站历史功率数据进行趋势分解,并对分解后的各趋势项训练机器学习预测模型,最后将各趋势项的预测结果依据分解模型进行趋势融合,完成对光伏功率的短期预测。
趋势分解是一种有效的处理时间序列数据的方式,时间序列数据通常有很多种潜在模式,趋势分解是将时间序列数据分解为四种基础模式:长期趋势项、季节变动项、循环变动项和随机波动项(随机波动项包含时间序列中其它所有信息)。
机器学习方法是指从给定的、有限的、用于学习的训练数据集合出发,假设数据是独立同分布产生的;并且假设要学习的模型属于某个函数集合,称为假设空间;应用某个评价准则,从假设空间中选取一个最优模型,使它对已知的训练数据及未知的测试数据在给定的评价准则下有最优的预测;最优模型的选取由算法实现。
本发明方法不仅可以为光伏电站控制和保障高比率光伏发电接入电网安全稳定运行提供基础性关键技术,而且通过精准的预测数据可以指导新能源电站合理发电,帮助电网调度优化新能源发电规划等。
实施例1:
本实施例涉及一种基于机器学习的光伏功率短期预测方法,步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行。如图1,包括以下步骤:
步骤S101、历史数据整合:从光伏电站一定时空尺度下的历史功率、气候气象、地理位置、电站设计、电气效率、管理运营等六个方面收集数据,并以时间作为索引将其整合为时间序列数据。
光资源和光伏功率影响因素多且影响机理复杂,不同因素在不同环境下对其影响程度不同,因此从多维度收集整合数据。具体的,气候气象数据主要包括大气层外辐照度、气溶胶光学厚度、太阳天顶角、时空尺度、空气质量指数、空气温度、降水量、湿度等;地理位置数据主要包括场地条件、周边环境、经纬度、地形等;电站设计数据主要包括光伏电池板倾角、自清洁能力、容量设计、放置设计、设备选型、阵列选型等;电气效率数据主要包括逆变器的最大功率点跟踪速度和精度、逆变器启动时间、逆变器温度、组件阵列的转化效率、灰尘的清洁频率、汇流箱的接触电阻和质量、电缆的电阻和温度等;管理运营数据主要包括弃光、清洁方式、清洁频率、调度约束、运营维护等。
步骤S102、数据集预处理:对步骤S101处理后的数据,将数据中连续取值的特征进行分箱处理,连续数据的分箱处理是指把一段连续的值按照数据内在统计特征切分成若干段,每一段的值作为一个分类取值,把连续值转换成离散值的过程。
对处理后的数据中存在的缺失值,根据数据缺失的原因和类型,使用不同的处理方法,诸如直接删除、替代填充(前值/后值/均值/众数/中位数/插值法等)、拟合填充(回归算法/极大似然估计算法/随机森林算法等)、衍生变量等。
对处理后的数据使用统计分析判别数据中是否存在不合理的异常值,对确认存在异常值的情况,可以将其视为数据的内在变现不予处理,也可以根据异常的原因和类型通过直接删除、用均值修正、以处理缺失值的方法进行处理。
步骤S103、时序趋势分解:光资源和光伏功率具有较强的昼夜周期性和季节周期性,同时其可在数分钟内实现从满功率到零功率的变化,具有较强的波动性、变化频率快、随机性强,而且影响光资源和光伏功率的各影响因素之间存在一定程度的相互作用,因此采用X-11分解法的乘法模型,将光伏功率的时序数据(Yt)进行趋势分解,将其分解为长期趋势项(Tt)、季节变动项(St)、循环变动项(Ct)和随机波动项(It),具体的模型为:Yt=Tt×St×Ct×It
步骤S104、最优特征筛选:对步骤S103处理后的数据设为因变量,以步骤S102处理后的数据作为自变量,通过反复构建Ridge(岭回归)模型,选出最好的的特征,把选出来的特征作为候选特征集,然后在剩余的特征上重复这个过程,直到遍历所有特征,过程中特征被消除的次序就是特征的排序,依据排序进行最优特征的筛选。其中,Ridge(岭回归)模型能够通过回归系数反映出参数的重要程度,模型倾向于保留更少的特征以减少模型的复杂程度。
步骤S105、机器学习建模:对步骤S104处理后的数据,以步骤S103趋势分解后的长期趋势项、季节变动项、循环变动项分别作为因变量,以步骤S104筛选后的特征数据作为自变量,基于自变量和因变量构成的样本数据,按照4:3:3的比例将样本数据划分为训练集、验证集和测试集,在训练集和验证集上分别训练长期趋势项、季节变动项、循环变动项的机器学习回归预测模型,在测试集上使用均方误差(MSE,mean squared error)指标进行各模型效果的评估,在确保均方误差达到一定的精度阈值时,完成机器学习的建模。
其中,对于按照步骤S103分解出来的随机波动项首先进行自相关检验,根据检验结果对随机波动项进行自回归模型拟合并对模型进行白噪声检验,通过检验后的自回归模型即为随机波动项预测模型。
步骤S106、预测趋势融合:对步骤S105处理后的数据,对长期趋势项的预测结果
Figure BDA0003378143440000051
季节变动项的预测结果
Figure BDA0003378143440000052
循环变动项的预测结果
Figure BDA0003378143440000053
和随机波动项
Figure BDA0003378143440000054
的预测结果按照步骤S103的趋势分解乘法模型进行趋势融合,光伏功率的短期预测
Figure BDA0003378143440000055
结果为:
Figure BDA0003378143440000056
其中趋势分解与机器学习建模部分的流程图如图2所示,具体包括:
步骤S201、进行光伏功率数据的时序整合;
步骤S202、使用X-11分解方法的乘法模型将功率数据分解为长期趋势项、季节变动项、循环变动项、随机波动项四部分;
步骤S203、将气候气象数据、地理位置数据、电站设计数据、电气效率数据、运营管理数据与长期趋势项、季节变动项、循环变动项进行数据匹配并分别建立回归预测模型进行训练与评估,对随机波动项使用自回归建模并进行白噪声检验;
步骤S204、最后将长期趋势项预测值、季节变动项预测值、循环变动项预测值、随机波动项预测值依据乘法模型进行趋势融合,完成光伏功率的短期预测。
实施例2:
本实施例涉及一种光伏功率短期预测的装置,该装置能以硬件或软件方式实现,用于完成光伏功率短期预测方法。如图3所示,所述预测装置100包括历史数据整合模块101,数据集预处理模块102,时序趋势分解模块103,最优特征筛选模块104,机器学习建模模块105、预测趋势融合模块106。
历史数据整合模块101,用于从光伏电站一定时空尺度下收集数据,并以时间作为索引将它们整合为时间序列数据;对应实施例1中步骤S101的内容;
数据集预处理模块102,用于将数据中连续取值的特征进行分箱处理,并进行缺失值和异常值的数据清洗;对应实施例1中步骤S102的内容;
时序趋势分解模块103,用于利用趋势分解法将光伏历史功率的时序数据进行趋势分解,将其分解为长期趋势项、季节变动项、循环变动项和随机波动项;对应实施例1中步骤S103的内容;
最优特征筛选模块104,用于使用基于岭回归的递归特征消除方法进行最优特征筛选;对应实施例1中步骤S104的内容;
机器学习建模模块105,用于分别对长期趋势项、季节变动项、循环变动项建立机器学习回归预测模型,使用均方误差指标进行模型效果的评估;对随机波动项使用自回归模型拟合并进行白噪声检验;对应实施例1中步骤S105的内容;
预测趋势融合模块106,用于对模型预测结果进行趋势融合,完成光伏功率的短期预测;对应实施例1中步骤S106的内容。
实施例3:
本实施例涉及一种光伏功率短期预测的电子设备,图4为本发明实施例提供的电子设备的实体结构示意图,该电子设备可以包括:处理器(processor)301、通信接口(Communications Interface)302、存储器(memory)303和总线304,其中,处理器301,通信接口302,存储器303通过总线304完成相互间的通信。处理器301可以调用存储在存储器303上并可在处理器301上运行的计算机程序,以执行上述实施例1提供的光伏功率短期预测方法。例如包括:历史数据整合:从光伏电站一定时空尺度下收集数据,并以时间作为索引将它们整合为时间序列数据;数据集预处理:将数据中连续取值的特征进行分箱处理,并进行缺失值和异常值的数据清洗;时序趋势分解:利用趋势分解法将光伏历史功率的时序数据进行趋势分解,将其分解为长期趋势项、季节变动项、循环变动项和随机波动项;最优特征筛选:使用基于岭回归的递归特征消除方法进行最优特征筛选;机器学习建模:分别对长期趋势项、季节变动项、循环变动项建立机器学习回归预测模型,使用均方误差指标进行模型效果的评估;对随机波动项使用自回归模型拟合并进行白噪声检验;预测趋势融合:对模型预测结果进行趋势融合,完成光伏功率的短期预测。
此外,上述的存储器303中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
实施例4:
本实施例涉及一种光伏功率短期预测的存储介质,存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:历史数据整合:从光伏电站一定时空尺度下收集数据,并以时间作为索引将它们整合为时间序列数据;数据集预处理:将数据中连续取值的特征进行分箱处理,并进行缺失值和异常值的数据清洗;时序趋势分解:利用趋势分解法将光伏历史功率的时序数据进行趋势分解,将其分解为长期趋势项、季节变动项、循环变动项和随机波动项;最优特征筛选:使用基于岭回归的递归特征消除方法进行最优特征筛选;机器学习建模:分别对长期趋势项、季节变动项、循环变动项建立机器学习回归预测模型,使用均方误差指标进行模型效果的评估;对随机波动项使用自回归模型拟合并进行白噪声检验;预测趋势融合:对模型预测结果进行趋势融合,完成光伏功率的短期预测。
本领域技术人员可以理解,上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。

Claims (8)

1.基于机器学习的光伏功率短期预测方法,其特征在于,所述方法包括:
历史数据整合:从光伏电站一定时空尺度下收集数据,并以时间作为索引将它们整合为时间序列数据;
数据集预处理:将数据中连续取值的特征进行分箱处理,并进行缺失值和异常值的数据清洗;
时序趋势分解:利用趋势分解法将光伏历史功率的时序数据进行趋势分解,将其分解为长期趋势项、季节变动项、循环变动项和随机波动项;
最优特征筛选:使用基于岭回归的递归特征消除方法进行最优特征筛选;
机器学习建模:分别对长期趋势项、季节变动项、循环变动项建立机器学习回归预测模型,使用均方误差指标进行模型效果的评估;对随机波动项使用自回归模型拟合并进行白噪声检验;
预测趋势融合:对模型预测结果进行趋势融合,完成光伏功率的短期预测。
2.根据权利要求1所述基于机器学习的光伏功率短期预测方法,其特征在于,从光伏电站一定时空尺度下收集数据,收集的数据包括:历史功率数据、气候气象数据、地理位置数据、电站设计数据、电气效率数据、管理运营数据。
3.根据权利要求2所述基于机器学习的光伏功率短期预测方法,其特征在于,所述气候气象数据包括大气层外辐照度、气溶胶光学厚度、太阳天顶角、时空尺度、空气质量指数、空气温度、降水量、湿度;
所述地理位置数据包括场地条件、周边环境、经纬度、地形;
所述电站设计数据包括光伏电池板倾角、自清洁能力、容量设计、放置设计、设备选型、阵列选型;
所述电气效率数据包括逆变器的最大功率点跟踪速度和精度、逆变器启动时间、逆变器温度、组件阵列的转化效率、灰尘的清洁频率、汇流箱的接触电阻和质量、电缆的电阻和温度;
所述管理运营数据包括弃光、清洁方式、清洁频率、调度约束、运营维护。
4.根据权利要求3所述基于机器学习的光伏功率短期预测方法,其特征在于,时序趋势分解中,采用X-11分解法。
5.根据权利要求4所述基于机器学习的光伏功率短期预测方法,其特征在于,预测趋势融合中,对长期趋势项的预测结果
Figure FDA0003378143430000011
季节变动项的预测结果
Figure FDA0003378143430000012
循环变动项的预测结果
Figure FDA0003378143430000013
和随机波动项的预测结果
Figure FDA0003378143430000014
进行趋势融合,光伏功率的短期预测结果
Figure FDA0003378143430000015
为:
Figure FDA0003378143430000016
6.一种基于机器学习的光伏功率短期预测的装置,其特征在于,所述装置包括:
历史数据整合模块,用于从光伏电站一定时空尺度下收集数据,并以时间作为索引将它们整合为时间序列数据;
数据集预处理模块,用于将数据中连续取值的特征进行分箱处理,并进行缺失值和异常值的数据清洗;
时序趋势分解模块,用于利用趋势分解法将光伏历史功率的时序数据进行趋势分解,将其分解为长期趋势项、季节变动项、循环变动项和随机波动项;
最优特征筛选模块,用于使用基于岭回归的递归特征消除方法进行最优特征筛选;
机器学习建模模块,用于分别对长期趋势项、季节变动项、循环变动项建立机器学习回归预测模型,使用均方误差指标进行模型效果的评估;对随机波动项使用自回归模型拟合并进行白噪声检验;
预测趋势融合模块,用于对模型预测结果进行趋势融合,完成光伏功率的短期预测。
7.一种基于机器学习的光伏功率短期预测的电子设备,其特征在于,包括:
至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至5中任意一项所述的预测方法。
8.一种基于机器学习的光伏功率短期预测的存储介质,其特征在于,所述存储介质存储计算机指令,所述计算机指令被计算机执行时实现如权利要求1至5中任意一项所述的预测方法。
CN202111425357.0A 2021-11-26 2021-11-26 基于机器学习的光伏功率短期预测方法、装置及存储介质 Pending CN113988477A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111425357.0A CN113988477A (zh) 2021-11-26 2021-11-26 基于机器学习的光伏功率短期预测方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111425357.0A CN113988477A (zh) 2021-11-26 2021-11-26 基于机器学习的光伏功率短期预测方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN113988477A true CN113988477A (zh) 2022-01-28

Family

ID=79732258

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111425357.0A Pending CN113988477A (zh) 2021-11-26 2021-11-26 基于机器学习的光伏功率短期预测方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN113988477A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114707769A (zh) * 2022-05-30 2022-07-05 广东电网有限责任公司佛山供电局 一种光伏发电出力短期预测方法及其相关装置
CN115082135A (zh) * 2022-08-23 2022-09-20 成都乐超人科技有限公司 一种信息差异识别方法、装置、设备及介质
CN115511220A (zh) * 2022-11-02 2022-12-23 河海大学 基于跨模态注意力机制的超短期太阳辐射预测方法及系统
CN115565379A (zh) * 2022-12-06 2023-01-03 成都智元汇信息技术股份有限公司 一种替换历史客流数据中异常客流数据的方法及系统
CN115828165A (zh) * 2023-02-15 2023-03-21 南京工大金泓能源科技有限公司 一种新能源智能微电网数据处理方法及系统
CN116167509A (zh) * 2022-07-20 2023-05-26 中科三清科技有限公司 气温预测方法、装置、存储介质及电子设备

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114707769A (zh) * 2022-05-30 2022-07-05 广东电网有限责任公司佛山供电局 一种光伏发电出力短期预测方法及其相关装置
CN114707769B (zh) * 2022-05-30 2022-08-23 广东电网有限责任公司佛山供电局 一种光伏发电出力短期预测方法及其相关装置
CN116167509A (zh) * 2022-07-20 2023-05-26 中科三清科技有限公司 气温预测方法、装置、存储介质及电子设备
CN116167509B (zh) * 2022-07-20 2023-09-29 中科三清科技有限公司 气温预测方法、装置、存储介质及电子设备
CN115082135A (zh) * 2022-08-23 2022-09-20 成都乐超人科技有限公司 一种信息差异识别方法、装置、设备及介质
CN115511220A (zh) * 2022-11-02 2022-12-23 河海大学 基于跨模态注意力机制的超短期太阳辐射预测方法及系统
CN115511220B (zh) * 2022-11-02 2023-06-13 河海大学 基于跨模态注意力机制的超短期太阳辐射预测方法及系统
CN115565379A (zh) * 2022-12-06 2023-01-03 成都智元汇信息技术股份有限公司 一种替换历史客流数据中异常客流数据的方法及系统
CN115828165A (zh) * 2023-02-15 2023-03-21 南京工大金泓能源科技有限公司 一种新能源智能微电网数据处理方法及系统
CN115828165B (zh) * 2023-02-15 2023-05-02 南京工大金泓能源科技有限公司 一种新能源智能微电网数据处理方法及系统

Similar Documents

Publication Publication Date Title
CN113988477A (zh) 基于机器学习的光伏功率短期预测方法、装置及存储介质
Jebli et al. Prediction of solar energy guided by pearson correlation using machine learning
CN113128793A (zh) 一种基于多源数据融合的光伏功率组合预测方法及系统
Feng et al. A taxonomical review on recent artificial intelligence applications to PV integration into power grids
US10956993B2 (en) Method and device for determining energy system operating scenario
Rodríguez et al. Forecasting intra-hour solar photovoltaic energy by assembling wavelet based time-frequency analysis with deep learning neural networks
CN109840633B (zh) 光伏输出功率预测方法、系统和存储介质
CN111160626B (zh) 一种基于分解融合的电力负荷时间序列控制方法
CN114792156A (zh) 基于曲线特征指标聚类的光伏输出功率预测方法和系统
CN108694475B (zh) 基于混合模型的短时间尺度光伏电池发电量预测方法
CN113837434A (zh) 太阳能光伏发电预测方法、装置、电子设备和存储介质
CN113111592A (zh) 一种基于emd-lstm的短期风电功率预测方法
CN117218425A (zh) 一种用于光伏电站的发电损失分析方法及系统
CN117033923A (zh) 一种基于可解释性机器学习的犯罪数量预测方法及系统
Yang et al. An improved spatial upscaling method for producing day‐ahead power forecasts for wind farm clusters
Shen et al. PV power interval prediction based on EEMD-LSTM method
Xia et al. Research on Solar Radiation Estimation based on Singular Spectrum Analysis-Deep Belief Network
Lim et al. Photovoltaic power predictions using modified adaptive response rate exponential smoothing method
Mahin et al. Advanced Forecasting of Wind Energy Generation Through Integration of AE-CLSTM
CN116342077B (zh) 一种适用于数据缺失场站的新能源功率迁移学习预测方法
Wang et al. Short-term power forecasting of fishing-solar complementary photovoltaic power station based on a data-driven model
Zjavka Wind speed and global radiation forecasting based on differential, deep and stochastic machine learning of patterns in 2-level historical meteo-quantity sets
Amoura et al. Hybrid optimisation and machine learning models for wind and solar data prediction
CN117154723B (zh) 基于多源数据和模型融合的台区短期负荷预测方法及系统
CN117151303B (zh) 一种基于混合模型的超短期太阳辐照度预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination