CN115049171B - 一种基于特征迁移的光伏功率预测方法及系统 - Google Patents

一种基于特征迁移的光伏功率预测方法及系统 Download PDF

Info

Publication number
CN115049171B
CN115049171B CN202210983674.2A CN202210983674A CN115049171B CN 115049171 B CN115049171 B CN 115049171B CN 202210983674 A CN202210983674 A CN 202210983674A CN 115049171 B CN115049171 B CN 115049171B
Authority
CN
China
Prior art keywords
data
photovoltaic power
matrix
prediction
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210983674.2A
Other languages
English (en)
Other versions
CN115049171A (zh
Inventor
闫涵
屈丽环
陈隆京
吴媛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sprixin Technology Co ltd
Original Assignee
Sprixin Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sprixin Technology Co ltd filed Critical Sprixin Technology Co ltd
Priority to CN202210983674.2A priority Critical patent/CN115049171B/zh
Publication of CN115049171A publication Critical patent/CN115049171A/zh
Application granted granted Critical
Publication of CN115049171B publication Critical patent/CN115049171B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/004Generation forecast, e.g. methods or systems for forecasting future energy generation
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/38Arrangements for parallely feeding a single network by two or more generators, converters or transformers
    • H02J3/381Dispersed generators
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2300/00Systems for supplying or distributing electric power characterised by decentralized, dispersed, or local generation
    • H02J2300/20The dispersed energy generation being of renewable origin
    • H02J2300/22The renewable source being solar energy
    • H02J2300/24The renewable source being solar energy of photovoltaic origin
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Abstract

本发明提出一种基于特征迁移的光伏功率预测方法及系统,获取光伏电站历史发电数据,去除异常值,作为模型训练的目标值;基于迁移成分分析法通过源域训练样本数据和目标域训练样本数据得到训练数据集;分别训练LSTM和Lasso模型进行光伏功率的预测,并将预测结果以固定权重系数进行光伏功率组合预测,得到最终的预测结果。本发明提高模型预测精度,提高了光伏发电短期功率预测的准确性和稳定性。

Description

一种基于特征迁移的光伏功率预测方法及系统
技术领域
本发明属于电力功率预测技术领域,特别是涉及到一种基于特征迁移的光伏功率预测方法及系统。
背景技术
光伏出力随天气变化而出现较大波动,给电力系统的运维带来极大的挑战。随着光伏并网规模的快速增长,为保证能源电力系统的安全稳定运行,亟需提高光伏发电的预测精度。目前,国内外学者已针对光伏发电短期预测问题提出如支持向量机、神经网络、降维聚类等诸多方法,研究的主要思路是将光伏发电预测问题转换为气象要素与光伏发电的回归问题,基于数值天气预报(numerical weather prediction,NWP),建立气象要素与光伏发电之间的映射模型,包含线性和非线性模型,常用方法包括:支持向量机(SVM:Support Vector Machines)、BP神经网络方法(BPNeural Network)和径向基函数神经网络(RBF Neural Networks)等。
影响光伏发电因素有很多,如太阳总辐射、散射辐射、天气温度、相对湿度、风速、风向和日降雨量等,而基于上面所述传统方法的光伏功率预测模型,特征过多势必影响模型的准确性,因此,有效提取光伏功率相关影响数据的选取尤为重要。此外,传统方法仅考虑了数值天气预报数据与光伏出力数据的映射关系,单纯的时间分析忽略了时空数据的非平稳性,经典的机器学习方法,如神经网络、支持向量机等,在模型训练过程中易陷入局部最优和过拟合状态,因此,传统的预测方法很难进一步提高光伏功率的预测精度。
发明内容
本发明提出一种基于特征迁移的光伏功率预测方法及系统,提高模型预测精度,提高了光伏发电短期功率预测的准确性和稳定性。
为达到上述目的,本发明的技术方案是这样实现的:
一种基于特征迁移的光伏功率预测方法,包括:
S1、获取光伏电站历史发电数据,去除异常值,作为模型训练的目标值;
S2、从数值天气预报中获取对应光伏电站历史发电数据的历史预测气象要素,并对气象要素提取与时间和地理相关的特征,构建目标域训练样本数据;
S3、从ERA5大气再分析气象数据中获取对应光伏电站历史发电数据的历史气象要素,并对气象要素提取与时间和地理相关的特征,构建源域训练样本数据;
S4、基于迁移成分分析法通过源域训练样本数据和目标域训练样本数据得到训练数据集;
S5、将目标值和训练数据集输入分别训练LSTM和Lasso模型,进行网格化搜索调参后,训练模型,得到训练好的LSTM模型和Lasso模型;
S6、通过训练好的LSTM模型和Lasso模型分别进行光伏功率的预测,并将预测结果以固定权重系数进行光伏功率组合预测,得到最终的预测结果。
进一步的,步骤S2与步骤S3中对气象要素提取与时间和地理相关的特征的方法包括:
S101、提取气象要素;
S102、提取与时间相关的特征,将气象要素数据的时间戳信息转换为离散的时间信息,给每条气象要素数据添加月份、周数、天数、小时数的标签;
S103、提取与地理相关的特征,给每条气象要素数据添加光伏方阵的倾角、经纬度信息,以及太阳高度角的正弦、太阳入射角的余弦的标签。
进一步的,步骤S4的具体方法包括:
S201、构建特征数为k1的目标域训练样本数据
Figure 100002_DEST_PATH_IMAGE002
,对应的标签
Figure 100002_DEST_PATH_IMAGE004
其中xTi是第i条目标域样本数据;yTi为xTi对应的标签;i=1,2,...,nt,;nt为目标域样本个数;
构建特征数为k2的源域样本数据
Figure 100002_DEST_PATH_IMAGE006
,k2>k1,对应的标签
Figure 100002_DEST_PATH_IMAGE008
其中xSj是第j条源域样本数据;ySj为xSj对应的标签;j=1,2,...,ns;ns为源域样本个数;
根据XS和XT分别构造出内核矩阵K和矩阵L,并构造中心矩阵H;
Figure 100002_DEST_PATH_IMAGE010
其中,KS,S,KT,T,KS,T,KT,S分别为源域、目标域以及混合域数据的核函数;
Figure 100002_DEST_PATH_IMAGE012
Figure 100002_DEST_PATH_IMAGE014
其中,
Figure 100002_DEST_PATH_IMAGE016
为单位矩阵,
Figure 100002_DEST_PATH_IMAGE018
为全l列向量;
R为全实域的(ns+nt)*(ns+nt) 阶矩阵;lT为l的转置矩阵;
S202、对矩阵(KLK+μI)-1KHK进行特征分解,将其中m个最大的特征值对应的特征向量组合到一起,得到投影矩阵W,其中m<(k1,k2)min,μ>0为权衡参数;
S203、通过W使得XS与XT投影转换得映射空间的数据集
Figure 100002_DEST_PATH_IMAGE020
Figure 100002_DEST_PATH_IMAGE022
,在保持源域与目标域数据集中的主要特征属性的同时,通过缩小领域间的样本均值距离来缩小领域间的边缘分布差异;
Figure 100002_DEST_PATH_IMAGE024
Figure 100002_DEST_PATH_IMAGE026
得到训练数据集
Figure 100002_DEST_PATH_IMAGE028
其中WT为W的转置矩阵。
进一步的,步骤S6所述固定权重系数的设置方法为:
首先,计算各单模型的绝对误差,公式如下:
Figure 100002_DEST_PATH_IMAGE030
;其中,Yi为i时刻的实际功率,Pit为i时刻第t个单模型的预测功率,N为求解固定权重系数的总样本数;
然后,按公式
Figure 100002_DEST_PATH_IMAGE032
计算各单模型的权重wt,单模型数量为T,且T≧2T。可见,单模型的绝对误差越大,其组合权重越小,反之,则权重越大。
本发明另一方面还提供了一种基于特征迁移的光伏功率预测系统,包括:
目标值模块,获取光伏电站历史发电数据,去除异常值,作为模型训练的目标值;
目标域模块,从数值天气预报中获取对应光伏电站历史发电数据的历史预测气象要素,并对气象要素提取与时间和地理相关的特征,构建目标域训练样本数据;
源域模块,从ERA5大气再分析气象数据中获取对应光伏电站历史发电数据的历史气象要素,并对气象要素提取与时间和地理相关的特征,构建源域训练样本数据;
TCA模块,基于迁移成分分析法通过源域训练样本数据和目标域训练样本数据得到训练数据集;
训练模块,将目标值和训练数据集输入分别训练LSTM和Lasso模型,进行网格化搜索调参后,训练模型,得到训练好的LSTM模型和Lasso模型;
预测模块,通过训练好的LSTM模型和Lasso模型分别进行光伏功率的预测,并将预测结果以固定权重系数进行光伏功率组合预测,得到最终的预测结果。
进一步的,目标域模块与源域模块中都设有特征提取单元,所述特征提取单元包括:
提取子单元,用于提取气象要素;
时间特征子单元,用于提取与时间相关的特征,将气象要素数据的时间戳信息转换为离散的时间信息,给每条气象要素数据添加月份、周数、天数、小时数的标签;
地理特征子单元,用于提取与地理相关的特征,给每条气象要素数据添加光伏方阵的倾角、经纬度信息,以及太阳高度角的正弦、太阳入射角的余弦的标签。
进一步的,所述TCA模块包括:
矩阵单元:构建特征数为k1的目标域训练样本数据
Figure 525677DEST_PATH_IMAGE002
,对应的标签
Figure 646080DEST_PATH_IMAGE004
其中xTi是第i条目标域样本数据;yTi为xTi对应的标签;i=1,2,...,nt,;nt为目标域样本个数;
构建特征数为k2的源域样本数据
Figure 100002_DEST_PATH_IMAGE033
,k2>k1,对应的标签
Figure 100002_DEST_PATH_IMAGE034
其中xSj是第j条源域样本数据;ySj为xSj对应的标签;j=1,2,...,ns;ns为源域样本个数;
根据XS和XT分别构造出内核矩阵K和矩阵L,并构造中心矩阵H;
Figure DEST_PATH_IMAGE035
其中,KS,S,KT,T,KS,T,KT,S分别为源域、目标域以及混合域数据的核函数;
Figure 100002_DEST_PATH_IMAGE036
Figure 2981DEST_PATH_IMAGE014
其中,
Figure 601452DEST_PATH_IMAGE016
为单位矩阵,
Figure 55305DEST_PATH_IMAGE018
为全l列向量;
R为全实域的(ns+nt)*(ns+nt) 阶矩阵;lT为l的转置矩阵;
特征分解单元:对矩阵(KLK+μI)-1KHK进行特征分解,将其中m个最大的特征值对应的特征向量组合到一起,得到投影矩阵W,其中m<(k1,k2)min,μ>0为权衡参数;
数据集单元:通过W使得XS与XT投影转换得映射空间的数据集
Figure 81030DEST_PATH_IMAGE020
Figure 613642DEST_PATH_IMAGE022
,在保持源域与目标域数据集中的主要特征属性的同时,通过缩小领域间的样本均值距离来缩小领域间的边缘分布差异;
Figure 219067DEST_PATH_IMAGE024
Figure 825629DEST_PATH_IMAGE026
得到训练数据集
Figure 520790DEST_PATH_IMAGE028
其中WT为W的转置矩阵。
进一步的,所述预测模块中包括固定权重系数单元,所述固定权重系数单元包括:
计算各单模型的绝对误差,公式如下:
Figure 806278DEST_PATH_IMAGE030
;其中,Yi为i时刻的实际功率,Pit为i时刻第t个单模型的预测功率,N为求解固定权重系数的总样本数;
按公式
Figure 480973DEST_PATH_IMAGE032
计算各单模型的权重wt,单模型数量为T,且T≧2T。可见,单模型的绝对误差越大,其组合权重越小,反之,则权重越大。
与现有技术相比,本发明具有如下的有益效果:
(1)本发明使用TCA方法最小化ERA5样本与数值气象预测样本在特征子空间上的最大均值差异,获取一个降维特征子空间,领域间的分布差异在此空间内缩小,从而实现ERA5数据的跨领域迁移,有效提高模型预测精度;
(2)本发明将Lasso线性回归模型和非线性LSTM神经网络的预测结果进行组合预测,提高模型预测的准确性和鲁棒性。
附图说明
图1是本发明实施例的流程示意图;
图2是本发明实施例的预测功率对比图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
本发明的设计思想在于:
一、基于TCA迁移成分分析实现ERA5再分析数据与数值天气预报的特征迁移:
ERA5再分析数据是一种经过对大气观测资料(包括地面观测、卫星,还有雷达、探空等)的质量控制,再同化入全球模式后得到的气象数据,有着时间序列长、空间分布广、准确度高的特点,具有很高的数据应用价值,为了挖掘气象数据与光伏功率更深层次的映射关系,本发明引入TCA特征迁移方法,有效从属于不同但相关领域的数据中提取出有价值的迁移成分,将映射后的源域带标签样本进行训练,提高模型预测精度。
由于ERA5数据不可获取到未来的预测,其准确性比预报场(数值天气预报的结果)要高得多,可以说,两个数据集之间的数据分布不同但非常相似,可以采用基于特征表示的方法对数据进行迁移。TCA(迁移成分分析)方法是在源域与目标域之间寻找适当的共同描述,通过求取最优的空间映射关系,使得领域间的分布差异在映射后的特征子空间内缩小,但同时不破坏数据原有的主要特征属性,从而实现源领域知识向目标领域的迁移,提高目标任务的分类精度。
二、使用组合预测:
长短期记忆网络(long short-term memory, LSTM)不仅能够挖掘输出与相关输入变量之间的空间和时序关联性,对于大数据驱动的模型训练过程拟合能力更强,且不易陷入局部最优和过拟合,更适用于挖掘天气状态变化与光伏功率波动的内在关联和潜在规律。本发明将Lasso线性回归模型和非线性LSTM神经网络的预测结果进行组合预测,可得到比单一模型预测更能得到令人满意的结果,分散了单一模型的预测风险,融合了线性和非线性预测模型的优势,进一步提升了预测模型的泛化能力,提高了光伏发电短期功率预测的准确性和稳定性。
基于上述设计思想,本发明提出的基于特征迁移的光伏功率预测方法如图1所示,包括:
1、获取光伏电站发电出力数据,去除异常值,作为模型训练的目标值
Figure 100002_DEST_PATH_IMAGE038
,yi为目标样本,n为样本总数,i=1,2,...,n;
2、由于光伏发电与时间、当地经纬度、方阵面上的太阳辐照量、云量和风速大小,风向均有关系,关键特征的提取和表征方式对于发现数据间的周期性规律和提高模型训练收敛速度来说十分重要,按照以下方式提取特征:
(1)提取气象预测要素,如:太阳水平面总辐射、倾斜面总辐射、太阳直接辐射、太阳散射辐射、低中高层云量、地面层和高层风速、风向(风向用风向余弦和风向正弦来表征)、温度、湿度、压强等;
(2)提取与时间和地理相关的特征,将气象数据的时间戳信息通过处理转换为离散的时间信息,给每条数据添加月份、周数、天数、小时数的标签;
(3)提取光伏方阵的倾角、经纬度信息,添加太阳高度角的正弦、太阳入射角的余弦的特征标签。
3、根据2中的方法,获取数值天气预报数据,所述数值天气预报数据与光伏电站发电出力数据相对应;构建特征数为k1的目标域训练样本数据
Figure 348566DEST_PATH_IMAGE002
,对应的标签
Figure 309569DEST_PATH_IMAGE004
;其中xTi是第i条目标域样本数据,包含多种特征,比如总辐射、直辐射、风速、风向、温度等等,也包含构造的一些特征量;yTi为xTi对应的标签;i=1,2,...,nt,;nt为目标域样本个数;作为测试集的样本数据;
4、获取光伏电站所在目标地区ERA5大气再分析气象数据,根据2中的方法,提取光伏电站站点处历史长时间序列的对应气象要素,构建特征数为k2的源域样本数据
Figure 190675DEST_PATH_IMAGE006
,k2>k1,对应的标签
Figure 669061DEST_PATH_IMAGE008
其中xSj是第j条源域样本数据;ySj为xSj对应的标签;j=1,2,...,ns;ns为源域样本个数;
5、根据XS和XT分别构造出内核矩阵K和矩阵L,并构造中心矩阵H;
Figure 578111DEST_PATH_IMAGE010
其中,KS,S,KT,T,KS,T,KT,S分别为源域、目标域以及混合域数据的核函数;
Figure 116540DEST_PATH_IMAGE036
Figure 986407DEST_PATH_IMAGE014
其中,
Figure 100002_DEST_PATH_IMAGE039
为单位矩阵,
Figure 32598DEST_PATH_IMAGE018
为全l列向量;
R为全实域的(ns+nt)*(ns+nt) 阶矩阵;lT为l的转置矩阵;
6、对矩阵(KLK+μI)-1KHK进行特征分解,将其中m个最大的特征值对应的特征向量组合到一起,得到投影矩阵W,其中m<(k1,k2)min,μ>0为权衡参数。
7、通过W使得XS与XT投影转换得映射空间的数据集
Figure 733838DEST_PATH_IMAGE020
Figure 646430DEST_PATH_IMAGE022
,在保持源域与目标域数据集中的主要特征属性的同时,通过缩小领域间的样本均值距离来缩小领域间的边缘分布差异;
Figure 800331DEST_PATH_IMAGE024
Figure 948415DEST_PATH_IMAGE026
得到训练数据集
Figure 2697DEST_PATH_IMAGE028
其中WT为W的转置矩阵。
8、将训练数据集
Figure 86190DEST_PATH_IMAGE028
输入分别训练LSTM和Lasso模型,进行网格化搜索调参后,训练模型,得到训练好的LSTM模型和Lasso模型;
9、将目标域测试集投影到映射空间
Figure 100002_DEST_PATH_IMAGE041
,代入训练好的LSTM模型和Lasso模型分别进行预测,并将预测结果以0.7和0.3为固定权重系数进行光伏功率组合预测,作为最终的预测结果。
所述固定权重系数的设置方法为:
首先,计算各单模型的绝对误差,公式如下:
Figure 258546DEST_PATH_IMAGE030
;其中,Yi为i时刻的实际功率,Pit为i时刻第t个单模型的预测功率,N为求解固定权重系数的总样本数;
然后,按公式
Figure 820108DEST_PATH_IMAGE032
计算各单模型的权重wt,单模型数量为T,且T≧2T。可见,单模型的绝对误差越大,其组合权重越小,反之,则权重越大。
具体应用案例:
获取某省装机容量为60MW的集中式光伏发电场的光伏发电数据,并获取数值预报结果,分别采用传统预测方法和本发明提供的方法进行预测;然后采用功率预测精度计算公式分别计算各方法的预测精度,所述功率预测精度计算公式如下:
Figure 100002_DEST_PATH_IMAGE043
其中,PMi为第i时刻的实际发电功率,Ppi为第i时刻的预测发电功率,Ci为第i时刻的开机容量,n为白天时段每15分钟的实际发电功率采集次数,i=1,2,...,n。
预测精度对比结果如下表所示:
Figure DEST_PATH_IMAGE045
可见,本发明所提供的方法可将预测精度提高近1%。
如图2所示为实际功率、传统方法预测功率、本发明方法预测功率的曲线图,可见本发明所述方法的预测功率曲线相较于传统方法的预测功率曲线,更为接近实际功率曲线。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于特征迁移的光伏功率预测方法,其特征在于,包括:
S1、获取光伏电站历史发电数据,去除异常值,作为模型训练的目标值;
S2、从数值天气预报中获取对应光伏电站历史发电数据的历史预测气象要素,并对气象要素提取与时间和地理相关的特征,构建目标域训练样本数据;
S3、从ERA5大气再分析气象数据中获取对应光伏电站历史发电数据的历史气象要素,并对气象要素提取与时间和地理相关的特征,构建源域训练样本数据;
S4、基于迁移成分分析法通过源域训练样本数据和目标域训练样本数据得到训练数据集;
S5、将目标值和训练数据集输入分别训练LSTM和Lasso模型,进行网格化搜索调参后,训练模型,得到训练好的LSTM模型和Lasso模型;
S6、通过训练好的LSTM模型和Lasso模型分别进行光伏功率的预测,并将预测结果以固定权重系数进行光伏功率组合预测,得到最终的预测结果。
2.根据权利要求1所述的基于特征迁移的光伏功率预测方法,其特征在于,步骤S2与步骤S3中对气象要素提取与时间和地理相关的特征包括:
S101、提取气象要素;
S102、提取与时间相关的特征,将气象要素数据的时间戳信息转换为离散的时间信息,给每条气象要素数据添加月份、周数、天数、小时数的标签;
S103、提取与地理相关的特征,给每条气象要素数据添加光伏方阵的倾角、经纬度信息,以及太阳高度角的正弦、太阳入射角的余弦的标签。
3.根据权利要求1所述的基于特征迁移的光伏功率预测方法,其特征在于,步骤S4的具体方法包括:
S201、构建特征数为k1的目标域训练样本数据
Figure DEST_PATH_IMAGE002
,对应的标签
Figure DEST_PATH_IMAGE004
其中xTi是第i条目标域样本数据;yTi为xTi对应的标签;i=1,2,...,nt,;nt为目标域样本个数;
构建特征数为k2的源域训练样本数据
Figure DEST_PATH_IMAGE006
,k2>k1,对应的标签
Figure DEST_PATH_IMAGE008
其中xSj是第j条源域样本数据;ySj为xSj对应的标签;j=1,2,...,ns;ns为源域样本个数;
根据XS和XT分别构造出内核矩阵K和矩阵L,并构造中心矩阵H;
Figure DEST_PATH_IMAGE010
其中,KS,S,KT,T,KS,T,KT,S分别为源域、目标域以及混合域数据的核函数;
Figure DEST_PATH_IMAGE012
Figure DEST_PATH_IMAGE014
其中,
Figure DEST_PATH_IMAGE016
为单位矩阵,
Figure DEST_PATH_IMAGE018
为全l列向量;
R为全实域的(ns+nt)*(ns+nt) 阶矩阵;lT为l的转置矩阵;
S202、对矩阵(KLK+μI)-1KHK进行特征分解,将其中m个最大的特征值对应的特征向量组合到一起,得到投影矩阵W,其中m<(k1,k2)min,μ>0为权衡参数;
S203、通过W使得XS与XT投影转换得映射空间的数据集
Figure DEST_PATH_IMAGE020
Figure DEST_PATH_IMAGE022
,在保持源域与目标域数据集中的主要特征属性的同时,通过缩小领域间的样本均值距离来缩小领域间的边缘分布差异;
Figure DEST_PATH_IMAGE024
Figure DEST_PATH_IMAGE026
得到训练数据集
Figure DEST_PATH_IMAGE028
其中WT为W的转置矩阵。
4.根据权利要求1所述的基于特征迁移的光伏功率预测方法,其特征在于,步骤S6所述固定权重系数的设置方法为:
首先,计算各单模型的绝对误差,公式如下:
Figure DEST_PATH_IMAGE030
;其中,Yi为i时刻的实际功率,Pit为i时刻第t个单模型的预测功率,N为求解固定权重系数的总样本数;
然后,按公式
Figure DEST_PATH_IMAGE032
计算各单模型的权重wt,单模型数量为T,且T≧2。
5.一种基于特征迁移的光伏功率预测系统,其特征在于,包括:
目标值模块,获取光伏电站历史发电数据,去除异常值,作为模型训练的目标值;
目标域模块,从数值天气预报中获取对应光伏电站历史发电数据的历史预测气象要素,并对气象要素提取与时间和地理相关的特征,构建目标域训练样本数据;
源域模块,从ERA5大气再分析气象数据中获取对应光伏电站历史发电数据的历史气象要素,并对气象要素提取与时间和地理相关的特征,构建源域训练样本数据;
TCA模块,基于迁移成分分析法通过源域训练样本数据和目标域训练样本数据得到训练数据集;
训练模块,将目标值和训练数据集输入分别训练LSTM和Lasso模型,进行网格化搜索调参后,训练模型,得到训练好的LSTM模型和Lasso模型;
预测模块,通过训练好的LSTM模型和Lasso模型分别进行光伏功率的预测,并将预测结果以固定权重系数进行光伏功率组合预测,得到最终的预测结果。
6.根据权利要求5所述的基于特征迁移的光伏功率预测系统,其特征在于,目标域模块与源域模块中都设有特征提取单元,所述特征提取单元包括:
提取子单元,用于提取气象要素;
时间特征子单元,用于提取与时间相关的特征,将气象要素数据的时间戳信息转换为离散的时间信息,给每条气象要素数据添加月份、周数、天数、小时数的标签;
地理特征子单元,用于提取与地理相关的特征,给每条气象要素数据添加光伏方阵的倾角、经纬度信息,以及太阳高度角的正弦、太阳入射角的余弦的标签。
7.根据权利要求5所述的基于特征迁移的光伏功率预测系统,其特征在于,所述TCA模块包括:
矩阵单元:构建特征数为k1的目标域训练样本数据
Figure DEST_PATH_IMAGE033
,对应的标签
Figure DEST_PATH_IMAGE034
其中xTi是第i条目标域样本数据;yTi为xTi对应的标签;i=1,2,...,nt,;nt为目标域样本个数;
构建特征数为k2的源域训练样本数据
Figure DEST_PATH_IMAGE036
,k2>k1,对应的标签
Figure DEST_PATH_IMAGE037
其中xSj是第j条源域样本数据;ySj为xSj对应的标签;j=1,2,...,ns;ns为源域样本个数;
根据XS和XT分别构造出内核矩阵K和矩阵L,并构造中心矩阵H;
Figure DEST_PATH_IMAGE038
其中,KS,S,KT,T,KS,T,KT,S分别为源域、目标域以及混合域数据的核函数;
Figure DEST_PATH_IMAGE039
Figure DEST_PATH_IMAGE041
其中,
Figure 100338DEST_PATH_IMAGE016
为单位矩阵,
Figure 955162DEST_PATH_IMAGE018
为全l列向量;
R为全实域的(ns+nt)*(ns+nt) 阶矩阵;lT为l的转置矩阵;
特征分解单元:对矩阵(KLK+μI)-1KHK进行特征分解,将其中m个最大的特征值对应的特征向量组合到一起,得到投影矩阵W,其中m<(k1,k2)min,μ>0为权衡参数;
数据集单元:通过W使得XS与XT投影转换得映射空间的数据集
Figure 952810DEST_PATH_IMAGE020
Figure 551281DEST_PATH_IMAGE022
,在保持源域与目标域数据集中的主要特征属性的同时,通过缩小领域间的样本均值距离来缩小领域间的边缘分布差异;
Figure 444282DEST_PATH_IMAGE024
Figure DEST_PATH_IMAGE042
得到训练数据集
Figure DEST_PATH_IMAGE043
其中WT为W的转置矩阵。
8.根据权利要求5所述的基于特征迁移的光伏功率预测系统,其特征在于,所述预测模块中包括固定权重系数单元,所述固定权重系数单元包括:
计算各单模型的绝对误差,公式如下:
Figure 610952DEST_PATH_IMAGE030
;其中,Yi为i时刻的实际功率,Pit为i时刻第t个单模型的预测功率,N为求解固定权重系数的总样本数;
按公式
Figure 81248DEST_PATH_IMAGE032
计算各单模型的权重wt,单模型数量为T,且T≧2。
CN202210983674.2A 2022-08-17 2022-08-17 一种基于特征迁移的光伏功率预测方法及系统 Active CN115049171B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210983674.2A CN115049171B (zh) 2022-08-17 2022-08-17 一种基于特征迁移的光伏功率预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210983674.2A CN115049171B (zh) 2022-08-17 2022-08-17 一种基于特征迁移的光伏功率预测方法及系统

Publications (2)

Publication Number Publication Date
CN115049171A CN115049171A (zh) 2022-09-13
CN115049171B true CN115049171B (zh) 2022-10-28

Family

ID=83167263

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210983674.2A Active CN115049171B (zh) 2022-08-17 2022-08-17 一种基于特征迁移的光伏功率预测方法及系统

Country Status (1)

Country Link
CN (1) CN115049171B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115347571B (zh) * 2022-10-17 2023-03-24 国网江西省电力有限公司电力科学研究院 基于迁移学习的光伏发电功率短期预测方法及装置
NL2033884B1 (en) * 2022-12-30 2023-09-06 Gansu Tongxing Intelligent Tech Development Co Ltd A Photovoltaic Power Prediction Method, System and Medium
CN116073436B (zh) * 2023-04-06 2023-06-13 山东创宇环保科技有限公司 一种光伏新能源电力系统容量优化控制方法
CN116722548B (zh) * 2023-08-09 2023-12-29 深圳航天科创泛在电气有限公司 一种基于时间序列模型的光伏发电预测方法及相关设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110766212A (zh) * 2019-10-15 2020-02-07 哈尔滨工程大学 用于历史数据缺失电场的超短期光伏功率预测方法
WO2021238505A1 (zh) * 2020-05-27 2021-12-02 华北电力大学 基于联邦学习的区域光伏功率概率预测方法及协同调控系统
CN113919232A (zh) * 2021-10-25 2022-01-11 北京航天创智科技有限公司 一种基于循环神经网络的光伏电站功率预测方法及系统
CN114219181A (zh) * 2022-01-20 2022-03-22 天津大学 基于迁移学习的风电功率概率预测方法
CN114462723A (zh) * 2022-04-12 2022-05-10 南方电网数字电网研究院有限公司 基于高空风资源影响的云层迁移分钟级光伏功率预测方法
CN114897264A (zh) * 2022-06-08 2022-08-12 国网浙江省电力有限公司嘉兴供电公司 一种基于迁移学习的小样本场景下光伏出力区间预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110766212A (zh) * 2019-10-15 2020-02-07 哈尔滨工程大学 用于历史数据缺失电场的超短期光伏功率预测方法
WO2021238505A1 (zh) * 2020-05-27 2021-12-02 华北电力大学 基于联邦学习的区域光伏功率概率预测方法及协同调控系统
CN113919232A (zh) * 2021-10-25 2022-01-11 北京航天创智科技有限公司 一种基于循环神经网络的光伏电站功率预测方法及系统
CN114219181A (zh) * 2022-01-20 2022-03-22 天津大学 基于迁移学习的风电功率概率预测方法
CN114462723A (zh) * 2022-04-12 2022-05-10 南方电网数字电网研究院有限公司 基于高空风资源影响的云层迁移分钟级光伏功率预测方法
CN114897264A (zh) * 2022-06-08 2022-08-12 国网浙江省电力有限公司嘉兴供电公司 一种基于迁移学习的小样本场景下光伏出力区间预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于SDA与SVR混合模型的迁移学习预测算法;任俊 等;《计算机科学》;20180131;第45卷(第01期);第280-284、312页 *
基于迁移成分分析的雷达辐射源识别方法研究;李蒙 等;《电子设计工程》;20171020;第25卷(第20期);第47-50、55页 *

Also Published As

Publication number Publication date
CN115049171A (zh) 2022-09-13

Similar Documents

Publication Publication Date Title
CN115049171B (zh) 一种基于特征迁移的光伏功率预测方法及系统
Zhang et al. A solar time based analog ensemble method for regional solar power forecasting
Yu et al. An LSTM short-term solar irradiance forecasting under complicated weather conditions
Huang et al. Hybrid deep neural model for hourly solar irradiance forecasting
Ceci et al. Predictive modeling of PV energy production: How to set up the learning task for a better prediction?
US10103548B2 (en) Operating a solar power generating system
Melzi et al. Hourly solar irradiance forecasting based on machine learning models
Yesilbudak et al. A review of data mining and solar power prediction
Mas' ud Comparison of three machine learning models for the prediction of hourly PV output power in Saudi Arabia
Kayri et al. Predicting power production from a photovoltaic panel through artificial neural networks using atmospheric indicators
Yildiz et al. A kernel extreme learning machine-based neural network to forecast very short-term power output of an on-grid photovoltaic power plant
CN112070311A (zh) 基于相似日聚类和气象因子赋权的日前光功率预测方法
Wu et al. Potential of Bayesian additive regression trees for predicting daily global and diffuse solar radiation in arid and humid areas
Zuo et al. Comparison of six machine learning methods for estimating PM2. 5 concentration using the Himawari-8 aerosol optical depth
Wojtkiewicz et al. A concept-drift based predictive-analytics framework: Application for real-time solar irradiance forecasting
Liu et al. Research of photovoltaic power forecasting based on big data and mRMR feature reduction
Bandong et al. Performance ratio estimation and prediction of solar power plants using machine learning to improve energy reliability
Ahmad et al. Support vector machine based prediction of photovoltaic module and power station parameters
Zhu et al. Photovoltaic generation prediction of CCIPCA combined with LSTM
CN113298304A (zh) 基于多维气象预报因子图卷积的光伏发电功率预测方法
Pytel et al. Use of Evolutionary Algorithm for Identifying Quantitative Impact of PM2. 5 and PM10 on PV Power Generation
Dong et al. A hybrid prediction model for wind speed using support vector machine and genetic programming in conjunction with error compensation
Tanaka et al. SVM-based multi-point prediction system of solar irradiance using DTW-based cluster analysis
Fu et al. Photovoltaic Power Prediction Based on Gray-scale Satellite Cloud Image and Optimized LSTM
Bai et al. Accurate four-hour-ahead probabilistic forecast of photovoltaic power generation based on multiple meteorological variables-aided intelligent optimization of numeric weather prediction data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant