CN116050666B - 一种辐照特征聚类的光伏发电功率预测方法 - Google Patents
一种辐照特征聚类的光伏发电功率预测方法 Download PDFInfo
- Publication number
- CN116050666B CN116050666B CN202310268379.3A CN202310268379A CN116050666B CN 116050666 B CN116050666 B CN 116050666B CN 202310268379 A CN202310268379 A CN 202310268379A CN 116050666 B CN116050666 B CN 116050666B
- Authority
- CN
- China
- Prior art keywords
- data
- weather
- irradiance
- clustering
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010248 power generation Methods 0.000 title claims abstract description 43
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 33
- 238000004458 analytical method Methods 0.000 claims abstract description 27
- 238000007405 data analysis Methods 0.000 claims abstract description 14
- 238000007637 random forest analysis Methods 0.000 claims abstract description 13
- 238000003064 k means clustering Methods 0.000 claims abstract description 11
- 230000004927 fusion Effects 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 8
- 238000003066 decision tree Methods 0.000 claims description 7
- 230000008033 biological extinction Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 230000005855 radiation Effects 0.000 claims description 6
- 101100001676 Emericella variicolor andK gene Proteins 0.000 claims description 3
- 238000012512 characterization method Methods 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000012800 visualization Methods 0.000 claims description 3
- 230000005611 electricity Effects 0.000 abstract description 4
- 238000012163 sequencing technique Methods 0.000 abstract description 2
- 238000012806 monitoring device Methods 0.000 abstract 1
- 238000012549 training Methods 0.000 description 18
- 230000007613 environmental effect Effects 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种辐照特征聚类的光伏发电功率预测方法,它包括如下步骤:利用数据采集服务器收集和储存多元气象因子数据、历史气象数据、天气预报数据以及历史发电功率数据;使用数据分析模块中的气象因子重要度分析模块,通过随机森林算法对多元气象因子数据重要度进行排序,剔除重要度较低的气象因子;使用数据分析模块中的天气种类分析模块,结合改进的K‑means聚类算法,分析天气类型并进行数据聚类;功率预测模块根据对时间尺度的需求,采用不同的模式进行光伏发电功率预测;将预测结果显示在监控设备。本发明可有效避免数据冗余,提升功率预测的精度,从而减少光伏电站由于限电导致的经济损失,提高光伏电站的运营管理效率。
Description
技术领域
本申请涉及光伏发电的技术领域,具体涉及一种辐照特征聚类的光伏发电功率预测方法。
背景技术
光伏发电无需消耗燃料,也没有任何污染物的排放,能够实现节约能源与保护环境的双重目标。但是光伏发电受到了多元气象因素的影响,导致其具有大的随机性与波动性。因此,为实现电力调度发电计划有序安排及新能源发电消纳,所有新能源站都装有功率预测系统。
常规的功率预测系统是将收集的历史气象数据与发电功率数据直接进行建模训练,从而得到未来光伏电站发电功率的预测数据值。对于不同的地区而言,不同的气象因子对于光伏发电功率的影响程度不同,且不同的气象因子数据之间也存在关联耦合,所以在训练预测模型时存在冗余的历史数据,不但会影响功率预测模型的训练时长,而且会降低功率预测的精度。同时,在不同的天气类型下,光伏发电的波动情况也有所不同,也会而影响功率预测的精度。
发明内容
本发明的目的在于,提供一种辐照特征聚类的光伏发电功率预测方法,将多元气象因子对于发电功率的重要度并且进行排序,剔除重要度较低的气象因子,避免数据冗余,缩短模型训练时长,并将历史功率数据和重要度较高的多元气象数据根据天气种类划分成不同的数据集输入模型进行功率预测,并通过功率预测模块进行超短期功率预测与短期功率预测,提升功率预测的精度,从而减少光伏电站由于限电导致的经济损失,提高光伏电站的运营管理效率。
本发明采取的技术方案是:一种辐照特征聚类的光伏发电功率预测方法,包括如下步骤:
S1:利用数据采集服务器收集和储存多元气象因子数据、历史气象数据、天气预报数据以及历史发电功率数据;
S2:使用数据分析模块中的气象因子重要度分析模块,通过随机森林算法对多元气象因子数据重要度进行排序,剔除重要度较低的气象因子;
S3:使用数据分析模块中的天气种类分析模块,利用ASHRAE晴空模型提取辐照特征指标,并且结合改进的K-means聚类算法,分析天气类型并且对历史气象数据和历史发电功率数据进行聚类;
所述改进的K-means算法的具体方法为:对提取的辐照特征进行归一化处理,并计算误差平方SSE和融合指标,以SSE下降曲线中类似于手肘拐点的对应的Q值作为最佳聚类数;将待聚类样本,即归一化后的辐照特征按照融合指标/>从小到大的顺序排列,并等量截取成Q份样本;在Q份样本中分别随机选取一个样本作为融合指标点,将每个融合指标点作为每份样本的初始聚类中心;计算每个待聚类样本与聚类中心的欧式距离/>,并将归为对应的类别E q ,以所有E q 类样本的平均值作为新的E q 聚类中心/> ;当判断目标函数不再变化,或者两次变化的差值小于阈值时终止迭代,并输出聚类结果,否则重新计算个样本与聚类中心的欧式距离;
S4:功率预测模块根据电力部门对时间尺度的需求,判断是否进行气象因子重要度分析和天气种类分析,并采用不同的预测模式进行光伏发电功率预测;
在预测未来15min-4h时,无需进行气象因子重要度分析和天气种类分析,功率预测模块进行超短期功率预测;
在预测未来24h-48h时,则需要进行气象因子重要度分析和天气种类分析,功率预测模块进行短期功率预测;
S5:将预测结果显示在监控设备,进行可视化处理。
进一步地,所述气象因子数据包括温度传感器采集的环境温度数据、风速传感器采集的环境风速数据、湿度传感器采集的环境湿度数据以及辐照度传感器采集的辐照强度数据。
进一步地,所述步骤S2的具体步骤为:
S201:将数据采集服务器收集的多元气象因子数据作为历史功率数据的特征变量;
S202:记输入变量集为:
其中,X j 为第j类气象因子的数据特征集,j =1,2,……,z;z为多元气象因子的数据类型数量;x j ()表示第j类气象因子数据特征集中的第/>个数据,/>=1,2,……,N;N为每类气象因子数据特征集中的数据数量;
S203:对于随机森林中的每一颗决策树,选择相应的袋外数据OOB(out of bag),计算袋外数据误差,并记为errOOB1;
S204:随机对袋外数据OOB中所有样本的特征X j 加入噪声干扰,改变样本在特征X j 处的值,再次计算袋外数据误差,记为errOOB2;
S205对于有Ntree棵树的随机森林,根据袋外数据误差errOOB1和加入噪声干扰后的袋外数据误差errOOB2,计算特征X j 的重要性为:
S206:计算每个特征的重要性,并按降序排序;
S207:确定需要剔除的比例,依据特征重要度剔除相应比例的特征,得到一个新的特征集;
S208:将新的特征集重复步骤S206~S207,直到剩下个特征,/>为提前设定的值;
S209:根据步骤S206~S208过程中得到的各个特征集和特征集对应的袋外误差率,选择袋外误差率最低的特征集。
进一步地,所述步骤S3的具体步骤为:
S301:根据光伏电站的地理位置确定坐标,将经纬度坐标输入进ASHRAE模型中,得到该地区的晴空辐照度值,并且以此作为基准值,晴空辐照度G T 的具体表达式为:
其中,G b 为水平辐照强度,G d 为散射辐照强度,A为大气质量为0时的太阳辐射强度,s为大气消光系数,为太阳高度角,T为日期编号,L为地理纬度,/>为太阳赤纬,/>为太阳时角;
S302:利用晴空辐照度G T 和实际辐照度G R ,计算晴朗指数K 1、最大辐照度比K 2、归一化离散差K 3和辐照度衰减值K 4 ,具体计算公式如下:
其中,K 1为晴朗指数,K 2为最大辐照度比,K 3为归一化离散差,K 4为辐照度衰减值,为晴空地表辐照模型的每日采样的第/>个离散采样值,/>为每日采样的第/>个真实的辐照度数据,/>为每日采样的样本数,/>=1,2,……,/>;
S303:利用改进的K-means算法,将辐照度指标进行聚类;
S304:根据输出的聚类结果,对历史数据贴上相应天气类型标签;
S305:根据天气类型标签,将历史气象数据和历史发电功率数据进行划分。
进一步地,所述步骤303的具体步骤为:
S3031:对提取的辐照特征,进行归一化处理;其中,/>表示第/>天的第/>个辐照特征指标,K 1,/>为第/>天提取的晴朗指数,K 2,/>为第/>天提取的最大辐照度比,K 3,/>为第/>天提取的归一化离散差,K 4,/>为第/>天提取的辐照度衰减值;得到归一化后的辐照特征/>,具体表达式如下:
其中,表示第/>天的第/>个辐照特征指标的归一化结果; />= 1,2,3,4;
S3032:计算误差平方SSE,以SSE下降曲线中类似于手肘拐点的对应的Q值作为最佳聚类数,误差平方SSE计算公式为:
其中,为第/>个簇,/>=1,2,……,/>,/>为聚类数目;p为每一簇中的所有数据点,为第/>个簇的聚类中心;
3033:定义辐照特征指标中的正负向指标,以K 1和K 2为正向指标,K 3和K 4为负向指标,计算第l天的融合指标,具体计算公式为:
;
S3034:将待聚类样本,即归一化后的辐照特征按照融合指标/>从小到大的顺序排列,并等量截取成Q份样本;在Q份样本中分别随机选取一个样本作为融合指标点,共Q个融合指标点,记作/>,o =1,2,……,Q;将每个融合指标点作为每份样本的初始聚类中心;
S3305:计算每个待聚类样本与对应的聚类中心/>的欧式距离/>:
;
S3306:根据最短距离原则,将归为对应的类别E q ,以所有E q 类样本的平均值作为新的E q 聚类中心/>,计算公式为:
其中,N o 为第o类样本的总数目;
S3307:当判断目标函数不再变化,或者两次变化的差值小于阈值时终止迭代,并输出聚类结果;否则重新计算每个样本与聚类中心的欧式距离,重复步骤S3305~S3306,目标函数/>的计算公式为:
。
本发明的有益效果在于:
(1)利用随机森林算法评估各个气象因子的重要性,从而找到与光伏发电相关性较高的气象因子变量,能够有效减小训练模型的训练时间,以及减小训练模型时数据冗余对光伏发电功率预测的影响;
(2)通过数据分析模块可根据外部采集的历史辐照度数据与模拟的辐照度进行对比分析,提取出多个辐照特征,并使用改进的K-means算法对辐照特征进行聚类,历史数据贴上相应的天气类型标签,根据天气类型标签即可将历史气象数据和历史发电功率数据划分成不同的天气类型;相较于传统K-means聚类算法的处理结果,本发明聚类结果的每一簇之间的界限更加清晰,分布也更为合理;
(3)通过功率预测模块可根据电力调度对预测时间尺度的需求进行算法选择,调取相关数据,进行超短期功率预测与短期功率预测,可以有效提升光伏发电功率预测的精度,从而减少光伏电站由于限电导致的经济损失,提高光伏电站的运营管理效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例的整体流程示意图;
图2为本发明实施例中数据分析模块的气象因子重要度分析模块流程图;
图3为本发明实施例中数据分析模块的天气种类分析模块流程图;
图4为本发明实施例所述的改进K-means算法聚类与传统K-means算法聚类结果的对比图;
图5为本发明实施例中功率预测模块的流程图;
图6为本发明实施例中短期功率预测的具体算法流程图。
实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明并不限于下面公开的具体实施例的限制。
除非另作定义,此处使用的技术术语或者科学术语应当为本申请所述领域内具有一般技能的人士所理解的通常意义。本专利申请说明书以及权利要求书中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样, “一个”或者“一”等类似词语也不表示数量限制,而是表示存在至少一个。 “连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。 “上”、 “下”、 “左”、 “右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也相应地改变。
如图1~图6所示,一种辐照特征聚类的光伏发电功率预测方法,包括如下步骤:
S1:利用数据采集服务器收集和储存多元气象因子数据、历史气象数据、天气预报数据以及历史发电功率数据;气象因子数据包括温度传感器采集的环境温度数据、风速传感器采集的环境风速数据、湿度传感器采集的环境湿度数据以及辐照度传感器采集的辐照强度数据。
S2:使用数据分析模块中的气象因子重要度分析模块,通过随机森林算法对多元气象因子数据重要度进行排序,剔除重要度较低的气象因子,避免数据冗余,从而找到与光伏发电相关性较高的气象因子变量,减小训练模型的训练时间,以及减小训练模型时数据冗余对光伏发电功率预测的影响。具体步骤如图2所示;
S201:将数据采集服务器收集的多元气象因子数据作为历史功率数据的特征变量。
S202:记输入变量集为:
其中,X j 为第j类气象因子的数据特征集,j =1,2,……,z;z为多元气象因子的数据类型数量;x j ()表示第j类气象因子数据特征集中的第/>个数据,/>=1,2,……,N;N为每类气象因子数据特征集中的数据数量。
S203:对于随机森林中的每一颗决策树,选择相应的袋外数据OOB(out of bag),计算袋外数据误差,并记为errOOB1。在发明实施例中,随机森林中决策树的数量默认设置为100~200。理论上决策树的数量越多越好,但是随着决策树数量的增加,计算时间也会相应增长,因此在实际应用中需结合实际问题和具体求解计算来选取合理的决策树个数。
S204:随机对袋外数据OOB中所有样本的特征X j 加入噪声干扰,改变样本在特征X j 处的值,再次计算袋外数据误差,记为errOOB2;加入随机噪声后,袋外数据准确率将大幅度下降,即errOOB2上升。
S205对于有Ntree棵树的随机森林,根据袋外数据误差errOOB1和加入噪声干扰后的袋外数据误差errOOB2,计算特征X j 的重要性为:
S206:计算每个特征的重要性,并按降序排序。
S207:确定需要剔除的比例,依据特征重要度剔除相应比例的特征,得到一个新的特征集。在本发明实施例中,重要性低于0.3的特征需进行剔除。
S208:将新的特征集重复步骤S206~S207,直到剩下个特征,/>为提前设定的值。
S209:根据步骤S206~S208过程中得到的各个特征集和特征集对应的袋外误差率,选择袋外误差率最低的特征集。
S3:使用数据分析模块中的天气种类分析模块,利用ASHRAE晴空模型提取辐照特征指标,并且结合改进的K-means聚类算法,分析天气类型并且对历史气象数据和历史发电功率数据进行聚类,具体步骤如图3所示:
S301:根据光伏电站的地理位置确定坐标,将经纬度坐标输入进ASHRAE模型中,得到该地区的晴空辐照度值,并且以此作为基准值,晴空辐照度G T 的具体表达式为:
其中,G b 为水平辐照强度,G d 为散射辐照强度,A为大气质量为0时的太阳辐射强度,s为大气消光系数,为太阳高度角,T为日期编号,在本发明实施例中,记1月1日的编号为1,,L为地理纬度,/>为太阳赤纬,/>为太阳时角。
S302:利用晴空辐照度G T 和实际辐照度G R ,计算晴朗指数K 1、最大辐照度比K 2、归一化离散差K 3和辐照度衰减值K 4 ,具体计算公式如下:
其中,K 1为晴朗指数,K 2为最大辐照度比,K 3为归一化离散差,K 4为辐照度衰减值,
为晴空地表辐照模型的每日采样的第/>个离散采样值,/>为每日采样的第/>个真实的辐照度数据,/>为每日采样的样本数,/>=1,2,……,/>。
S303:利用改进的K-means算法,将辐照度指标进行聚类,具体步骤如下:
S3031:对提取的辐照特征,进行归一化处理;其中,/>表示第/>天的第/>个辐照特征指标,K 1,/>为第/>天提取的晴朗指数,K 2,/>为第/>天提取的最大辐照度比,K 3,/>为第/>天提取的归一化离散差,K 4,/>为第/>天提取的辐照度衰减值;得到归一化后的辐照特征/>,具体表达式如下:
其中,表示第/>天的第/>个辐照特征指标的归一化结果;/> = 1,2,3,4。
S3032:计算误差平方SSE,误差平方SSE会随着数据聚合度的提升急剧减小,以SSE下降曲线中类似于手肘拐点的对应的Q值作为最佳聚类数,误差平方SSE计算公式为:
其中,为第/>个簇,/>=1,2,……,/>,/>为聚类数目;p为每一簇中的所有数据点,为第/>个簇的聚类中心; 以上海某光伏电站的数据进行测试,所得的最佳聚类数为4,即Q= 4。
S3033:定义辐照特征指标中的正负向指标,以K 1和K 2为正向指标,K 3和K 4为负向指标,计算第天的融合指标/>,具体计算公式为:
。
S3034:将待聚类样本,即归一化后的辐照特征按照融合指标/>从小到大的顺序排列,并等量截取成Q份样本;在Q份样本中分别随机选取一个样本作为融合指标点,共Q个融合指标点,记作/>,o =1,2,……,Q;将每个融合指标点作为每份样本的初始聚类中心。
S3305:计算每个待聚类样本与对应的聚类中心/>的欧式距离/>:
;
S3306:根据最短距离原则,将归为对应的类别E q ,以所有E q 类样本的平均值作为新的E q 聚类中心/>,计算公式为:
其中,N o 为第o类样本的总数目;
S3307:当判断目标函数不再变化,或者两次变化的差值小于阈值时终止迭代,并输出聚类结果;否则重新计算每个样本与聚类中心的欧式距离,重复步骤S3305~S3306,目标函数/>的计算公式为:
。
S304:根据输出的聚类结果,对历史数据贴上相应天气类型标签。
S305:根据天气类型标签,将历史气象数据和历史发电功率数据划分成四种天气类型,分别为晴天、阴天、多云和雨天。
图4为使用本发明实施例所述的改进的K-means聚类算法处理后的聚类结果与传统的K-means聚类算法处理结果的对比图,其中,图4(a)为传统的K-means聚类算法的处理结果,图4(b)为本发明实施例所述的改进的K-means聚类算法的处理结果。从聚类结果可以看出,传统K-means聚类算法处理结果的各簇之间的分布较为杂乱,本发明实施的处理结果的每一簇之间的界限更加清晰,分布也更为合理。
S4:如图5所示,功率预测模块根据电力部门对时间尺度的需求,判断是否进行气象因子重要度分析和天气种类分析,并采用不同的预测模式进行光伏发电功率预测。
在预测未来15min-4h时,无需进行气象因子重要度分析和天气种类分析,功率预测模块读取步骤S1中数据采集服务器收集和储存的历史发电功率数据,输入时间序列预测模型进行超短期功率预测;本发明实施例使用的输入时间序列预测模型为LSTM、GUR等深度学习预测模型,模型结构和模型预测方法均为本领域技术人员所公知的技术,在此不在详细进行赘述。
在预测未来24h-48h时,则需要进行气象因子重要度分析和天气种类分析,功率预测模块读取步骤S2和S3中经数据分析模块处理的多元气象因子数据、历史气象数据和历史发电功率数据,输入神经网络预测模型进行训练,训练完毕后功率预测模块读取步骤S1中数据采集服务器收集和储存的天气预报数据,并输入训练完毕后的神经网络预测模型进行短期功率预测。
图6为本发明实施例中短期功率预测的具体算法流程。首先,将历史气象数据和历史发电功率数据通过上述的辐照特征聚类的方法将数据集划分为:晴天数据、阴天数据、多云数据和雨天数据,并且将每种数据集都分成训练集和测试集。其次,将测试集数据输入神经网络模型进行训练,训练完毕后,输入测试集数据用于评价预测模型的预测精度,以此可以构建出晴天模型、阴天模型、多云模型和雨天模型。最后,判断天气预报数据的天气类型,将数据输入进对应的模型中,即可输出预测功率值。
其中,在训练神经网络预测模型中,输入变量为经过气象因子重要度分析的多元气象因子数据,输出变量为发电功率数据。本发明实施例使用的神经网络预测模型,采用的神经网络预测算法为BP、ELM和GA-BP等机器学习算法。模型结构和模型预测方法均为本领域技术人员所公知的技术,在此不在详细进行赘述。
S5:将预测结果显示在监控设备,进行可视化处理。
本发明实施例利用随机森林算法评估各个气象因子的重要性,从而找到与光伏发电相关性较高的气象因子变量,减小训练模型的训练时间,以及减小训练模型时数据冗余对光伏发电功率预测的影响。数据分析模块能够根据外部采集的历史辐照度数据与模拟的辐照度进行对比分析,提取出多个辐照特征,并使用改进的K-means算法对辐照特征进行聚类,历史数据贴上相应的天气类型标签,根据天气类型标签即可将历史气象数据和历史发电功率数据划分成不同的天气类型;相较于传统K-means聚类算法的处理结果,本发明聚类结果的每一簇之间的界限更加清晰,分布也更为合理。功率预测模块可根据电力调度对预测时间尺度的需求进行算法选择,调取相关数据,进行超短期功率预测与短期功率预测,有效提升光伏发电功率预测的精度,从而减少光伏电站由于限电导致的经济损失,提高光伏电站的运营管理效率。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (1)
1.一种辐照特征聚类的光伏发电功率预测方法,其特征在于,包括如下步骤:
S1:利用数据采集服务器收集和储存多元气象因子数据、历史气象数据、天气预报数据以及历史发电功率数据;
S2:使用数据分析模块中的气象因子重要度分析模块,通过随机森林算法对多元气象因子数据重要度进行排序,剔除重要度较低的气象因子,数据分析的具体步骤为:
S201:将数据采集服务器收集的多元气象因子数据作为历史功率数据的特征变量;
S202:记输入变量集为:
;
其中,X j 为第j类气象因子的数据特征集,j =1,2,……,z;z为多元气象因子的数据类型数量;x j 表示第j类气象因子数据特征集中的第/>个数据,/>=1,2,……,N;N为每类气象因子数据特征集中的数据数量;
S203:对于随机森林中的每一棵决策树,选择相应的袋外数据OOB(out of bag),计算袋外数据误差,并记为errOOB1;
S204:随机对袋外数据OOB中所有样本的特征X j 加入噪声干扰,改变样本在特征X j 处的值,再次计算袋外数据误差,记为errOOB2;
S205:对于有Ntree棵树的随机森林,根据袋外数据误差errOOB1和加入噪声干扰后的袋外数据误差errOOB2,计算特征X j 的重要性为:
;
S206:计算每个特征的重要性,并按降序排序;
S207:确定需要剔除的比例,依据特征重要度剔除相应比例的特征,得到一个新的特征集;
S208:将新的特征集重复步骤S206~S207,直到剩下个特征,/>为提前设定的值;
S209:根据步骤S206~S208过程中得到的各个特征集和特征集对应的袋外误差率,选择袋外误差率最低的特征集;
S3:使用数据分析模块中的天气种类分析模块,利用ASHRAE晴空模型提取辐照特征指标,并且结合改进的K-means聚类算法,分析天气类型并且对历史气象数据和历史发电功率数据进行聚类;所述改进的K-means算法的具体方法为:对提取的辐照特征进行归一化处理,并计算误差平方SSE和融合指标,以SSE下降曲线中类似于手肘拐点的对应的Q值作为最佳聚类数;将待聚类样本,即归一化后的辐照特征按照融合指标/>从小到大的顺序排列,并等量截取成Q份样本;在Q份样本中分别随机选取一个样本作为融合指标点,将每个融合指标点作为每份样本的初始聚类中心;计算每个待聚类样本与聚类中心的欧式距离/>,并将/>归为对应的类别E q ,以所有E q 类样本的平均值作为新的E q 聚类中心/>;当判断目标函数/>不再变化,或者两次变化的差值小于阈值时终止迭代,并输出聚类结果,否则重新计算各样本与聚类中心的欧式距离;
其中,提取辐照特征以及结合改进K-means算法,分析天气类型的具体步骤如下:
S301:根据光伏电站的地理位置确定坐标,将经纬度坐标输入进ASHRAE模型中,得到该地理位置的晴空辐照度值,并且以此作为基准值,晴空辐照度G T 的具体表达式为:
;
其中,G b 为水平辐照强度,G d 为散射辐照强度,A为大气质量为0时的太阳辐射强度,s为大气消光系数,为太阳高度角,T为日期编号,L为地理纬度,/>为太阳赤纬,/>为太阳时角;
S302:利用晴空辐照度G T 和实际辐照度G R ,计算晴朗指数K 1、最大辐照度比K 2、归一化离散差K 3和辐照度衰减值K 4 ,具体计算公式如下:
;
其中,K 1为晴朗指数,K 2为最大辐照度比,K 3为归一化离散差,K 4为辐照度衰减值,
为晴空地表辐照模型的每日采样的第/>个离散采样值,/>为每日采样的第/>个真实的辐照度数据,/>为每日采样的样本数,/>=1,2,……,/>;
S303:利用改进的K-means算法,将辐照度指标进行聚类,其具体步骤为:
S3031:对提取的辐照特征,进行归一化处理;其中,/>表示第/>天的第/>个辐照特征指标,K 1,/>为第/>天提取的晴朗指数,K 2,/>为第/>天提取的最大辐照度比,K 3,/>为第/>天提取的归一化离散差,K 4,/>为第/>天提取的辐照度衰减值;得到归一化后的辐照特征/>,具体表达式如下:
;
其中,表示第/>天的第/>个辐照特征指标的归一化结果;/>= 1,2,3,4;
S3032:计算误差平方SSE,以SSE下降曲线中类似于手肘拐点的对应的Q值作为最佳聚类数,误差平方SSE计算公式为:
;
其中,为第/>个簇,/>=1,2,……,/>,/>为聚类数目;p为每一簇中的所有数据点,/>为第/>个簇的聚类中心;
S3033:定义辐照特征指标中的正负向指标,以K 1和K 2为正向指标,K 3和K 4为负向指标,计算第天的融合指标/>,具体计算公式为:
;
S3034:将待聚类样本,即归一化后的辐照特征按照融合指标/>从小到大的顺序排列,并等量截取成Q份样本;在Q份样本中分别随机选取一个样本作为融合指标点,共Q个融合指标点,记作/>,o =1,2,……,Q;将每个融合指标点作为每份样本的初始聚类中心;
S3305:计算每个待聚类样本与对应的聚类中心/>的欧式距离/>:
;
S3306:根据最短距离原则,将归为对应的类别E q ,以所有E q 类样本的平均值作为新的E q 聚类中心/>,计算公式为:
;
其中,N o 为第o类样本的总数目;
S3307:当判断目标函数不再变化,或者两次变化的差值小于阈值时终止迭代,并输出聚类结果;否则重新计算每个样本与聚类中心的欧式距离,重复步骤S3305~S3306,目标函数/>的计算公式为:
;
S304:根据输出的聚类结果,对历史数据贴上相应天气类型标签;
S305:根据天气类型标签,将历史气象数据和历史发电功率数据进行划分;
S4:功率预测模块根据电力部门对时间尺度的需求,判断是否进行气象因子重要度分析和天气种类分析,并采用不同的预测模式进行光伏发电功率预测;
在预测未来15min-4h时,无需进行气象因子重要度分析和天气种类分析,功率预测模块进行超短期功率预测;
在预测未来24h-48h时,则需要进行气象因子重要度分析和天气种类分析,功率预测模块进行短期功率预测;
S5:将预测结果显示在监控设备,进行可视化处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310268379.3A CN116050666B (zh) | 2023-03-20 | 2023-03-20 | 一种辐照特征聚类的光伏发电功率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310268379.3A CN116050666B (zh) | 2023-03-20 | 2023-03-20 | 一种辐照特征聚类的光伏发电功率预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116050666A CN116050666A (zh) | 2023-05-02 |
CN116050666B true CN116050666B (zh) | 2023-07-18 |
Family
ID=86114897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310268379.3A Active CN116050666B (zh) | 2023-03-20 | 2023-03-20 | 一种辐照特征聚类的光伏发电功率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116050666B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116307269B (zh) * | 2023-05-16 | 2023-10-31 | 华能山东泰丰新能源有限公司 | 一种基于人工智能的光伏发电功率预测方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112561139A (zh) * | 2020-12-03 | 2021-03-26 | 安徽大学 | 一种短期光伏发电功率预测方法和系统 |
CN114511132A (zh) * | 2021-12-28 | 2022-05-17 | 上海能源科技发展有限公司 | 一种光伏出力短期预测方法及预测系统 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170286838A1 (en) * | 2016-03-29 | 2017-10-05 | International Business Machines Corporation | Predicting solar power generation using semi-supervised learning |
CN106251008A (zh) * | 2016-07-25 | 2016-12-21 | 南京工程学院 | 一种基于组合权重相似日选取的光伏功率预测方法 |
CN106529814B (zh) * | 2016-11-21 | 2020-01-07 | 武汉大学 | 基于Adaboost聚类和马尔科夫链的分布式光伏超短期预测方法 |
CN107944604B (zh) * | 2017-11-10 | 2022-11-25 | 中国电力科学研究院有限公司 | 一种用于光伏功率预测的天气类型识别方法和装置 |
CN109934423B (zh) * | 2019-04-25 | 2020-04-21 | 山东大学 | 基于并网逆变器运行数据的光伏电站功率预测方法及系统 |
CN110705789A (zh) * | 2019-09-30 | 2020-01-17 | 国网青海省电力公司经济技术研究院 | 一种光伏电站短期功率预测方法 |
CN110929953A (zh) * | 2019-12-04 | 2020-03-27 | 国网山东省电力公司电力科学研究院 | 基于聚类分析的光伏电站超短期出力预测方法 |
CN112085272A (zh) * | 2020-09-07 | 2020-12-15 | 国网甘肃省电力公司电力科学研究院 | 一种风功率预测方法 |
CN112070311A (zh) * | 2020-09-10 | 2020-12-11 | 天津大学 | 基于相似日聚类和气象因子赋权的日前光功率预测方法 |
CN113762387B (zh) * | 2021-09-08 | 2024-02-02 | 东北大学 | 一种基于混合模型预测的数据中心站多元负荷预测方法 |
CN114792156B (zh) * | 2022-03-10 | 2024-06-14 | 国网甘肃省电力公司电力科学研究院 | 基于曲线特征指标聚类的光伏输出功率预测方法和系统 |
CN114819369A (zh) * | 2022-05-05 | 2022-07-29 | 国网吉林省电力有限公司 | 基于两段式特征选择和随机森林改进模型的短期风电功率预测方法 |
CN114971081A (zh) * | 2022-06-29 | 2022-08-30 | 中国电建集团江西省电力建设有限公司 | 一种基于时间序列分析与日统计的辐照预测方法 |
-
2023
- 2023-03-20 CN CN202310268379.3A patent/CN116050666B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112561139A (zh) * | 2020-12-03 | 2021-03-26 | 安徽大学 | 一种短期光伏发电功率预测方法和系统 |
CN114511132A (zh) * | 2021-12-28 | 2022-05-17 | 上海能源科技发展有限公司 | 一种光伏出力短期预测方法及预测系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116050666A (zh) | 2023-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112749904B (zh) | 基于深度学习的配电网故障风险预警方法及系统 | |
CN107766990B (zh) | 一种光伏电站发电功率的预测方法 | |
CN107944622B (zh) | 基于连续时段聚类的风电功率预测方法 | |
CN112257941B (zh) | 基于改进型Bi-LSTM的光伏电站短期功率预测方法 | |
CN106447098B (zh) | 一种光伏超短期功率预测方法及装置 | |
CN109002915B (zh) | 基于Kmeans-GRA-Elman模型的光伏电站短期功率预测方法 | |
CN106022528B (zh) | 一种基于密度峰值层次聚类的光伏电站短期功率预测方法 | |
CN111260126B (zh) | 计及天气与气象因子关联度的短期光伏发电预测方法 | |
CN109165774A (zh) | 一种短期光伏功率预测方法 | |
CN106251001A (zh) | 一种基于改进模糊聚类算法的光伏功率预测方法 | |
CN109711609A (zh) | 基于小波变换和极限学习机的光伏电站输出功率预测方法 | |
CN114792156B (zh) | 基于曲线特征指标聚类的光伏输出功率预测方法和系统 | |
CN116050666B (zh) | 一种辐照特征聚类的光伏发电功率预测方法 | |
CN112990558B (zh) | 一种基于深度迁移学习的气象温度、光照的预测方法 | |
CN110766134A (zh) | 基于循环神经网络的光伏电站短期功率预测方法 | |
CN114048896B (zh) | 光伏发电数据的预测方法、系统、设备及介质 | |
CN109978039B (zh) | 一种基于不平衡数据集情况下的风机叶片结冰预测方法 | |
CN115829105A (zh) | 基于历史数据特征搜索的光伏功率预测方法 | |
CN102147839A (zh) | 一种光伏发电量预测方法 | |
CN114399081A (zh) | 一种基于天气分类的光伏发电功率预测方法 | |
CN104915727B (zh) | 多维度同构异质bp神经网络光功率超短期预测方法 | |
CN105574612A (zh) | 一种基于数据挖掘的光伏发电量预测方法 | |
CN115796434A (zh) | 一种用于配电网的管控方法、装置、电子设备及存储介质 | |
CN115759467A (zh) | 一种误差修正的分时刻集成学习光伏预测方法 | |
CN111179108A (zh) | 用电能耗的预测方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |