CN107944604B - 一种用于光伏功率预测的天气类型识别方法和装置 - Google Patents
一种用于光伏功率预测的天气类型识别方法和装置 Download PDFInfo
- Publication number
- CN107944604B CN107944604B CN201711101360.0A CN201711101360A CN107944604B CN 107944604 B CN107944604 B CN 107944604B CN 201711101360 A CN201711101360 A CN 201711101360A CN 107944604 B CN107944604 B CN 107944604B
- Authority
- CN
- China
- Prior art keywords
- meteorological
- historical data
- weather
- photovoltaic power
- diff
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000003062 neural network model Methods 0.000 claims abstract description 33
- 238000003064 k means clustering Methods 0.000 claims abstract description 18
- 239000013598 vector Substances 0.000 claims abstract description 12
- 238000004140 cleaning Methods 0.000 claims description 26
- 238000012549 training Methods 0.000 claims description 14
- 238000013528 artificial neural network Methods 0.000 claims description 13
- 238000005457 optimization Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 11
- 239000000523 sample Substances 0.000 description 11
- 238000004590 computer program Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 3
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 238000010248 power generation Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Photovoltaic Devices (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种用于光伏功率预测的天气类型识别方法和装置,先对光伏气象站的历史数据进行清洗,并根据清洗后的历史数据确定每日气象特征库,然后对每日气象特征库中的气象特征样本进行K‑means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签,最后通过反向传播神经网络模型实现预测日天气类型的识别,识别过程简单,且识别出的天气类型比较稀少,能够保证光伏功率预测结果的准确性;本发明采用了支持向量回归法对光伏气象站的历史数据进行清洗,提高了数据的可靠性,且本发明采用混合的气象特征区分不同的天气类型,着重强调辐照波动性对光伏输出的影响,更适合光伏功率预测。
Description
技术领域
本发明涉及新能源技术领域,具体涉及一种用于光伏功率预测的天气类型识别方法和装置。
背景技术
目前,由于能源危机和环境恶化,太阳能成为化石能源的重要替代品。作为太阳能利用的重要技术路径,光伏发电系统近年来发展迅速。2015年,中国成为全球光伏发电装机容量最大的国家。但是,由于光伏电站的大规模开发建设,电网的稳定和电能质量受到严重影响,光伏消纳已成为光伏产业进一步发展的重要障碍,而功率预测又是解决光伏消纳问题的有效途径。一方面,功率预测可以提供重要的瞬态功率信息,用于协调控制和电网优化调度,另一方面,功率预测可以提高光伏消纳能力,增加光伏电站投资回报率。
光伏发电系统的输出功率与周围气象条件,特别是辐照强度有着密切的联系。而辐照强度会受到地理位置、季节因素、云层遮盖等影响,在不同的天气状况下呈现不同的波动性,其预测精度难以提高。当前,关于光伏功率预测的研究有好多,一般都通过建立子模型提高光伏功率预测模型的泛化能力,从而提升光伏功率预测精度。一般情况下,子模型采用相似性较高的数据,也就是说先将历史数据按照相似度分为若干类,然后每一类数据建立子模型。天气类型识别的主要作用就是将气象条件类似的数据样本归为一类,建立子模型以排除干扰因素,提高预测精度。当前,天气类型识别主要来源于天气预报。现有技术关于光伏功率预测方面的研究较多,相关研究分析了影响光伏出力的气象因素,结合光伏系统实际运行数据和气象信息,提出基于天气类型聚类和LS-SVM的光伏出力预测模型。选取太阳辐照时间、温度、相对湿度等作为气象特征向量,通过计算各向量的加权欧氏距离,筛选出最佳聚类集合,确定训练样本,使样本数据能更好地反映待预测日的实际气象信息。取最佳聚类日气象特征、相应光伏出力及待预测日气象特征输入训练好的LS-SVM模型,输出为待预测日对应时刻的光伏出力。但是基于天气类型聚类和LS-SVM的光伏出力预测方法中该天气类型繁多且过于精细,增加了光伏出力预测模型的复杂程度,计算效率低,实时性差。除了上述研究,现有技术中还以光照强度和温度作为输入量,分季节建立了基于LVQ-GA-BP神经网络预测系统,通过学习向量量化(Learning Vector Quantization,LVQ)神经网络对天气类型进行分类和识别。基于LVQ-GA-BP神经网络光伏电站出力短期预测方法中天气类型分类过于关注气象信息,对气象数据波动性关注不多,导致光伏功率预测结果不准确。
发明内容
为了克服上述现有技术中天气类型繁多、过于精细以及光伏功率预测结果不准确的不足,本发明提供一种用于光伏功率预测的天气类型识别方法和装置,先对光伏气象站的历史数据进行清洗,并根据清洗后的历史数据确定每日气象特征库,然后对每日气象特征库中的气象特征样本进行K-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签,最后通过反向传播神经网络模型实现预测日天气类型的识别。
为了实现上述发明目的,本发明采取如下技术方案:
本发明提供一种用于光伏功率预测的天气类型识别方法,包括:
对光伏气象站的历史数据进行清洗,并根据清洗后的历史数据确定每日气象特征库;
对每日气象特征库中的气象特征样本进行K-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签;
通过反向传播神经网络模型对预测日天气类型进行识别;
所述反向传播神经网络模型通过对最终聚类结果和类别标签进行训练得到。
所述历史数据包括光伏气象站收集的气象信息和电力计量装置收集的功率信息;
所述气象信息包括辐照强度和温度。
所述对光伏气象站的历史数据进行清洗包括:
采用支持向量回归法对历史数据进行拟合,得到如下式的历史数据的光伏功率残差:
REi=|Pi-Pi′|
其中,REi表示第i个历史数据的光伏功率残差,Pi表示第i个历史数据的实时功率,Pi′表示第i个历史数据拟合后的实时功率;
将历史数据的光伏功率残差与残差阈值进行对比,并将超过残差阈值的历史数据进行排除。
所述每日气象特征库包括气象特征样本;
所述气象特征样本对应的气象特征包括气象指标和辐照波动指标;
所述气象指标包括最大辐照强度IRmax和最高温度Tmax;
所述辐照波动指标包括最大波动DIFFIRmax、波动标准差STDIR、波动均值MVIR和波动三阶导数MVIR;其中DIFFIRmax按下式确定:
DIFFIRmax=max(DIFFIRi)
其中,DIFFIRi表示第i个历史数据的一阶差分,且DIFFIRi=IRi+1-IRi,i=1,2,...,n-1,IRi+1表示第i+1个历史数据的辐照度,IRi表示第i个历史数据的辐照度。
所述气象特征样本的格式为[IRmax,Tmax,DIFFIRmax,STDIR,MVIR,TDIRmax]。
所述对每日气象特征库中的气象特征样本进行K-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签,包括:
根据最大值特征[IRmax,Tmax,DIFFIRmax,TDIRmax]对气象特征样本进行第一次聚类,并通过第一轮廓系数对第一次聚类结果进行优化,得到优化结果;
根据优化结果对统计特征[STDIR,MVIR]进行第二次聚类,并通过第二轮廓系数对第二次聚类结果进行优化,得到最终聚类结果和类别标签。
所述通过反向传播神经网络模型对预测日天气类型进行识别,包括:
利用反向传播神经网络对最终的聚类结果和类别标签进行训练,得到反向传播神经网络模型;
将预测日的气象特征输入反向传播神经网络模型,得到预测日的天气类型。
本发明还提供一种用于光伏功率预测的天气类型识别装置,包括:
清洗模块,用于对光伏气象站的历史数据进行清洗,并根据清洗后的历史数据确定每日气象特征库;
聚类模块,用于对每日气象特征库中的气象特征样本进行K-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签;
识别模块,用于通过反向传播神经网络模型对预测日天气类型进行识别;
所述反向传播神经网络模型通过对最终聚类结果和类别标签进行训练得到。
所述历史数据包括光伏气象站收集的气象信息和电力计量装置收集的功率信息;
所述气象信息包括辐照强度和温度。
所述清洗模块具体用于:
采用支持向量回归法对历史数据进行拟合,得到如下式的历史数据的光伏功率残差:
REi=|Pi-Pi′|
其中,REi表示第i个历史数据的光伏功率残差,Pi表示第i个历史数据的实时功率,Pi′表示第i个历史数据拟合后的实时功率;
将历史数据的光伏功率残差与残差阈值进行对比,并将超过残差阈值的历史数据进行排除。
所述每日气象特征库包括气象特征样本;
所述气象特征样本对应的气象特征包括气象指标和辐照波动指标;
所述气象指标包括最大辐照强度IRmax和最高温度Tmax;
所述辐照波动指标包括最大波动DIFFIRmax、波动标准差STDIR、波动均值MVIR和波动三阶导数MVIR;其中DIFFIRmax按下式确定:
DIFFIRmax=max(DIFFIRi)
其中,DIFFIRi表示第i个历史数据的一阶差分,且DIFFIRi=IRi+1-IRi,i=1,2,...,n-1,IRi+1表示第i+1个历史数据的辐照度,IRi表示第i个历史数据的辐照度。
所述气象特征样本的格式为[IRmax,Tmax,DIFFIRmax,STDIR,MVIR,TDIRmax]。
所述聚类模块具体用于:
根据最大值特征[IRmax,Tmax,DIFFIRmax,TDIRmax]对气象特征样本进行第一次聚类,并通过第一轮廓系数对第一次聚类结果进行优化,得到优化结果;
根据优化结果对统计特征[STDIR,MVIR]进行第二次聚类,并通过第二轮廓系数对第二次聚类结果进行优化,得到最终聚类结果和类别标签。
所述识别模块具体用于:
利用反向传播神经网络对最终的聚类结果和类别标签进行训练,得到反向传播神经网络模型;
将预测日的气象特征输入反向传播神经网络模型,得到预测日的天气类型。
与最接近的现有技术相比,本发明提供的技术方案具有以下有益效果:
本发明提供的用于光伏功率预测的天气类型识别方法中,先对光伏气象站的历史数据进行清洗,并根据清洗后的历史数据确定每日气象特征库,然后对每日气象特征库中的气象特征样本进行K-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签,最后通过反向传播神经网络模型实现预测日天气类型的识别,识别过程简单,且识别出的天气类型比较稀少,能够保证光伏功率预测结果的准确性;
本发明提供的用于光伏功率预测的天气类型识别装置包括用于对光伏气象站的历史数据进行清洗并根据清洗后的历史数据确定每日气象特征库的清洗模块,用于对每日气象特征库中的气象特征样本进行K-means聚类并对聚类结果进行优化的聚类模块以及用于通过反向传播神经网络模型对预测日天气类型进行识别的识别模块,最终实现预测日天气类型的识别;
本发明提供的技术方案采用光伏气象站的历史数据,包括光伏气象站收集的气象信息和电力计量装置收集的功率信息,能够反映光伏电站的实际天气变化情况;
本发明提供的技术方案采用了支持向量回归法对光伏气象站的历史数据进行清洗,提高了数据的可靠性;
本发明提供的技术方案采用了最大辐照强度、最高温度、最大波动、波动标准差、波动均值和波动三阶导数组成的混合的气象特征用于区分不同的天气类型,着重强调辐照波动性对光伏输出的影响,更适合光伏功率预测;
本发明提供的技术方案采用了分层的K-means聚类,综合光伏最大出力状况和波动状况,分类合理,更加能够反映现场实际情况。
附图说明
图1是本发明实施例1中用于光伏功率预测的天气类型识别方法流程图;
图2是本发明实施例1中光伏气象站的历史数据清洗流程图;
图3是本发明实施例1中气象特征样本的K-means聚类流程图;
图4是本发明实施例1中反向传播神经网络基本结构示意图;
图5是本发明实施例2中数据清洗前的SVR拟合残差分布示意图;
图6是本发明实施例2中数据清洗后的SVR拟合残差分布示意图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
实施例1
本发明实施例1提供一种用于光伏功率预测的天气类型识别方法,该方法的具体流程如图1所示,具体包括以下步骤:
S101;对光伏气象站的历史数据进行清洗,并根据清洗后的历史数据确定每日气象特征库;
S102;对S101确定的每日气象特征库中的气象特征样本进行K-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签;
S103;通过反向传播神经网络模型对预测日天气类型进行识别,其中的反向传播神经网络模型通过对S102得到的最终聚类结果和类别标签进行训练得到。
上述S101中的历史数据包括光伏气象站收集的气象信息和电力计量装置收集的功率信息,其中气象信息包括辐照强度和温度。
上述S101中,对光伏气象站的历史数据进行清洗具体流程如图2所示,具体过程如下:
1)采用支持向量回归法对历史数据进行拟合,得到如下式的历史数据的光伏功率残差:
REi=|Pi-Pi′|
其中,REi表示第i个历史数据的光伏功率残差,Pi表示第i个历史数据的实时功率,Pi′表示第i个历史数据拟合后的实时功率;
2)将历史数据的光伏功率残差与残差阈值进行对比,并将超过残差阈值的历史数据进行排除。
上述S101确定的每日气象特征库包括多个气象特征样本,每个气象特征样本对应的气象特征包括气象指标和辐照波动指标;
其中的气象指标包括最大辐照强度IRmax和最高温度Tmax;
其中的辐照波动指标包括最大波动DIFFIRmax、波动标准差STDIR、波动均值MVIR和波动三阶导数MVIR;其中DIFFIRmax=max(DIFFIRi),DIFFIRi表示第i个历史数据的一阶差分,且DIFFIRi=IRi+1-IRi,i=1,2,...,n-1,IRi+1表示第i+1个历史数据的辐照度,IRi表示第i个历史数据的辐照度。
上述气象特征样本的格式为[IRmax,Tmax,DIFFIRmax,STDIR,MVIR,TDIRmax]。
上述S102中,对每日气象特征库中的气象特征样本进行K-means聚类(具体的K-means聚类流程如图3所示),并对聚类结果进行优化,得到最终聚类结果和类别标签,具体过程如下:
1)根据最大值特征[IRmax,Tmax,DIFFIRmax,TDIRmax]对气象特征样本进行第一次聚类,并通过第一轮廓系数对第一次聚类结果进行优化,得到优化结果;
2)根据优化结果对统计特征[STDIR,MVIR]进行第二次聚类,并通过第二轮廓系数对第二次聚类结果进行优化,得到最终聚类结果和类别标签。
S103中,通过反向传播神经网络模型对预测日天气类型进行识别的具体过程如下:
1)利用反向传播神经网络对最终的聚类结果和类别标签进行训练,得到反向传播神经网络模型,反向传播神经网络基本结构如图4所示,其中x1-xk为k个输入,y1-ym为y个输出,Φ1-Φk为k个中间量。计算过程由正向计算过程和反向计算过程组成。正向传播过程,输入模式从输入层经隐单元层逐层处理,并转向输出层,每一层神经元的状态只影响下一层神经元的状态。如果在输出层不能得到期望的输出,则转入反向传播,将误差信号沿原来的连接通路返回,通过修改各神经元的权值,使得误差信号最小。
2)将预测日的气象特征输入反向传播神经网络模型,得到预测日的天气类型。
基于同一发明构思,本发明实施例1还提供了一种用于光伏功率预测的天气类型识别装置,这些设备解决问题的原理与上述的用于光伏功率预测的天气类型识别方法相似,本发明实施例1提供的用于光伏功率预测的天气类型识别装置包括清洗模块、聚类模块和识别模块,下面分别对上述三个模块的功能进行详细说明:
其中的清洗模块,用于对光伏气象站的历史数据进行清洗,并根据清洗后的历史数据确定每日气象特征库;
其中的聚类模块,用于对每日气象特征库中的气象特征样本进行K-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签;
其中的识别模块,用于通过反向传播神经网络模型对预测日天气类型进行识别,其中的反向传播神经网络模型通过对最终聚类结果和类别标签进行训练得到。
上述的历史数据包括光伏气象站收集的气象信息和电力计量装置收集的功率信息,气象信息又包括辐照强度和温度。
上述的清洗模块对光伏气象站的历史数据进行清洗的具体过程如下:
1)采用支持向量回归法对历史数据进行拟合,得到如下式的历史数据的光伏功率残差:
REi=|Pi-Pi′|
其中,REi表示第i个历史数据的光伏功率残差,Pi表示第i个历史数据的实时功率,Pi′表示第i个历史数据拟合后的实时功率;
2)将历史数据的光伏功率残差与残差阈值进行对比,并将超过残差阈值的历史数据进行排除。
上述每日气象特征库包括多个气象特征样本,每个气象特征样本对应的气象特征包括气象指标和辐照波动指标;
其中的气象指标包括最大辐照强度IRmax和最高温度Tmax;
其中的辐照波动指标包括最大波动DIFFIRmax、波动标准差STDIR、波动均值MVIR和波动三阶导数MVIR;其中DIFFIRmax=max(DIFFIRi),DIFFIRi表示第i个历史数据的一阶差分,且DIFFIRi=IRi+1-IRi,i=1,2,...,n-1,IRi+1表示第i+1个历史数据的辐照度,IRi表示第i个历史数据的辐照度。
上述气象特征样本的格式为[IRmax,Tmax,DIFFIRmax,STDIR,MVIR,TDIRmax]。
上述聚类模块对每日气象特征库中的气象特征样本进行K-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签,具体过程如下:
1)根据最大值特征[IRmax,Tmax,DIFFIRmax,TDIRmax]对气象特征样本进行第一次聚类,并通过第一轮廓系数对第一次聚类结果进行优化,得到优化结果;
2)根据优化结果对统计特征[STDIR,MVIR]进行第二次聚类,并通过第二轮廓系数对第二次聚类结果进行优化,得到最终聚类结果和类别标签。
上述识别模块通过反向传播神经网络模型对预测日天气类型进行识别,具体过程如下:
1)利用反向传播神经网络对最终的聚类结果和类别标签进行训练,得到反向传播神经网络模型;
2)将预测日的气象特征输入反向传播神经网络模型,得到预测日的天气类型。
实施例2
本发明实施例2提供了一种用于光伏功率预测的天气类型识别方法,具体包括以下步骤:
步骤一、对光伏气象站的历史数据进行清洗,并根据清洗后的历史数据确定每日气象特征库:
所采用的历史数据包括2016年4月和2017年2月中国江苏省吴江区光伏电站31397个有效数据,时间跨度为9个月295天。
首先,将辐照强度IRi和温度Ti最为输入,并将实时功率Pi作为输出,建立SVR(支持向量回归)模型,并通过交叉验证方法优化参数。SVR模型的惩罚参数c=194.02,内核参数g=0.0098。
然后,通过SVR模型拟合计算残差:
REi=|Pi-Pi′|
其中,REi表示第i个历史数据的光伏功率残差,Pi表示第i个历史数据的实时功率,Pi′表示第i个历史数据拟合后的实时功率;
最后,将残差超过阈值THR的历史数据排除。阈值THR的确定方法是:残差按照大小降序排列,前5%的历史数据被认为是异常数据,后95%的历史数据是合格数据。清洗的历史数据为1570条。确定THR=175kW。
为了评估光伏实时功率的拟合精度,选择平均绝对百分比误差εMAPE衡量全局误差,并选择均方根误差εRMSE衡量本发明实施例2中预测值和实际值之间的差异,设n为历史数据总数,εMAPE和εRMSE分别按下式计算:
清洗前后残差分布的直方图分别如图5和图6所示,数据清洗前后的εMAPE和εRMSE如表1:
表1
可见,经过数据清洗,异常数据被排除,拟合精度明显提升,拟合残差的分布更为合理。数据清理后,建模数据集的价值密度有所提高。
气象特征样本[IRmax,Tmax,DIFFIRmax,STDIR,MVIR,TDIRmax]包含261个有效的气象特征样本,如表2,这些特征样本将通过K-means聚类为建模数据提供类别标签。
表2
步骤二、对每日气象特征库中的气象特征样本进行K-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签:
一般来说,如果聚类数太大,聚类的意义将会下降。因此,最大聚类数设置为Kmax=15。在聚类结果优化中,两层模型(分别使用[IRmax,Tmax,DIFFIRmax,TDIR]和[STDIR,MVIR])中的聚类数的区间都设置为2-15。通过校核轮廓系数,两层的最优聚类数都为2。因此,所有的特征样本最终将被分为四类(A,B,C和D),最终聚类结果如表3:
表3
步骤三、通过反向传播神经网络模型对预测日天气类型进行识别:
261个气象特征样本由K-means聚类分为四类(A,B,C和D)。这些气象特征样本将用于建立天气类型识别的多分类反向传播神经网络模型。选择70%的气象特征样本(183个)作为训练样本,剩余的30%(78个)用作测试样本。天气类型测试的结果如表4:
表4
可见,所有的78个测试样本中有四个样本被错误分类,反向传播神经网络的分类精度达到94.87%。此外,在四类样本中只有B类样本被错误分类。这表明反向传播神经网络分类器的识别准确度足够高,可用于天气识别。因此,该反向传播神经网络模型用于确定预测日的天气类型较为合适。
为了描述的方便,以上所述装置的各部分以功能分为各种模块或单元分别描述。当然,在实施本申请时可以把各模块或单元的功能在同一个或多个软件或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,所属领域的普通技术人员参照上述实施例依然可以对本发明的具体实施方式进行修改或者等同替换,这些未脱离本发明精神和范围的任何修改或者等同替换,均在申请待批的本发明的权利要求保护范围之内。
Claims (12)
1.一种用于光伏功率预测的天气类型识别方法,其特征在于,包括:
对光伏气象站的历史数据进行清洗,并根据清洗后的历史数据确定每日气象特征库;
对每日气象特征库中的气象特征样本进行K-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签;
通过反向传播神经网络模型对预测日天气类型进行识别;
所述反向传播神经网络模型通过对最终聚类结果和类别标签进行训练得到;
所述每日气象特征库包括气象特征样本;
所述气象特征样本对应的气象特征包括气象指标和辐照波动指标;
所述气象指标包括最大辐照强度IRmax和最高温度Tmax;
所述辐照波动指标包括最大波动DIFFIRmax、波动标准差STDIR、波动均值MVIR和波动三阶导数TDIRmax;其中DIFFIRmax按下式确定:
DIFFIRmax=max(DIFFIRi)
其中,DIFFIRi表示第i个历史数据的一阶差分,且DIFFIRi=IRi+1-IRi,i=1,2,...,n-1,IRi+1表示第i+1个历史数据的辐照度,IRi表示第i个历史数据的辐照度。
2.根据权利要求1所述的用于光伏功率预测的天气类型识别方法,其特征在于,所述历史数据包括光伏气象站收集的气象信息和电力计量装置收集的功率信息;
所述气象信息包括辐照强度和温度。
3.根据权利要求1所述的用于光伏功率预测的天气类型识别方法,其特征在于,所述对光伏气象站的历史数据进行清洗包括:
采用支持向量回归法对历史数据进行拟合,得到如下式的历史数据的光伏功率残差:
REi=|Pi-Pi′|
其中,REi表示第i个历史数据的光伏功率残差,Pi表示第i个历史数据的实时功率,Pi′表示第i个历史数据拟合后的实时功率;
将历史数据的光伏功率残差与残差阈值进行对比,并将超过残差阈值的历史数据进行排除。
4.根据权利要求1所述的用于光伏功率预测的天气类型识别方法,其特征在于,所述气象特征样本的格式为:
[IRmax,Tmax,DIFFIRmax,STDIR,MVIR,TDIRmax]。
5.根据权利要求1或4所述的用于光伏功率预测的天气类型识别方法,其特征在于,所述对每日气象特征库中的气象特征样本进行K-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签,包括:
根据最大值特征[IRmax,Tmax,DIFFIRmax,TDIRmax]对气象特征样本进行第一次聚类,并通过第一轮廓系数对第一次聚类结果进行优化,得到优化结果;
根据优化结果对统计特征[STDIR,MVIR]进行第二次聚类,并通过第二轮廓系数对第二次聚类结果进行优化,得到最终聚类结果和类别标签。
6.根据权利要求1所述的用于光伏功率预测的天气类型识别方法,其特征在于,所述通过反向传播神经网络模型对预测日天气类型进行识别,包括:
利用反向传播神经网络对最终的聚类结果和类别标签进行训练,得到反向传播神经网络模型;
将预测日的气象特征输入反向传播神经网络模型,得到预测日的天气类型。
7.一种用于光伏功率预测的天气类型识别装置,其特征在于,包括:
清洗模块,用于对光伏气象站的历史数据进行清洗,并根据清洗后的历史数据确定每日气象特征库;
聚类模块,用于对每日气象特征库中的气象特征样本进行K-means聚类,并对聚类结果进行优化,得到最终聚类结果和类别标签;
识别模块,用于通过反向传播神经网络模型对预测日天气类型进行识别;
所述反向传播神经网络模型通过对最终聚类结果和类别标签进行训练得到;
所述每日气象特征库包括气象特征样本;
所述气象特征样本对应的气象特征包括气象指标和辐照波动指标;
所述气象指标包括最大辐照强度IRmax和最高温度Tmax;
所述辐照波动指标包括最大波动DIFFIRmax、波动标准差STDIR、波动均值MVIR和波动三阶导数TDIRmax;其中DIFFIRmax按下式确定:
DIFFIRmax=max(DIFFIRi)
其中,DIFFIRi表示第i个历史数据的一阶差分,且DIFFIRi=IRi+1-IRi,i=1,2,...,n-1,IRi+1表示第i+1个历史数据的辐照度,IRi表示第i个历史数据的辐照度。
8.根据权利要求7所述的用于光伏功率预测的天气类型识别装置,其特征在于,所述历史数据包括光伏气象站收集的气象信息和电力计量装置收集的功率信息;
所述气象信息包括辐照强度和温度。
9.根据权利要求7所述的用于光伏功率预测的天气类型识别装置,其特征在于,所述清洗模块具体用于:
采用支持向量回归法对历史数据进行拟合,得到如下式的历史数据的光伏功率残差:
REi=|Pi-Pi′|
其中,REi表示第i个历史数据的光伏功率残差,Pi表示第i个历史数据的实时功率,Pi′表示第i个历史数据拟合后的实时功率;
将历史数据的光伏功率残差与残差阈值进行对比,并将超过残差阈值的历史数据进行排除。
10.根据权利要求7所述的用于光伏功率预测的天气类型识别装置,其特征在于,所述气象特征样本的格式为:
[IRmax,Tmax,DIFFIRmax,STDIR,MVIR,TDIRmax]。
11.根据权利要求7或10所述的用于光伏功率预测的天气类型识别装置,其特征在于,所述聚类模块具体用于:
根据最大值特征[IRmax,Tmax,DIFFIRmax,TDIRmax]对气象特征样本进行第一次聚类,并通过第一轮廓系数对第一次聚类结果进行优化,得到优化结果;
根据优化结果对统计特征[STDIR,MVIR]进行第二次聚类,并通过第二轮廓系数对第二次聚类结果进行优化,得到最终聚类结果和类别标签。
12.根据权利要求7所述的用于光伏功率预测的天气类型识别装置,其特征在于,所述识别模块具体用于:
利用反向传播神经网络对最终的聚类结果和类别标签进行训练,得到反向传播神经网络模型;
将预测日的气象特征输入反向传播神经网络模型,得到预测日的天气类型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711101360.0A CN107944604B (zh) | 2017-11-10 | 2017-11-10 | 一种用于光伏功率预测的天气类型识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711101360.0A CN107944604B (zh) | 2017-11-10 | 2017-11-10 | 一种用于光伏功率预测的天气类型识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107944604A CN107944604A (zh) | 2018-04-20 |
CN107944604B true CN107944604B (zh) | 2022-11-25 |
Family
ID=61933714
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711101360.0A Active CN107944604B (zh) | 2017-11-10 | 2017-11-10 | 一种用于光伏功率预测的天气类型识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107944604B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109102102A (zh) * | 2018-06-25 | 2018-12-28 | 南京邮电大学 | 基于多变量相空间重构和svr的光伏出力短期预测方法 |
CN109271466A (zh) * | 2018-08-30 | 2019-01-25 | 昆明理工大学 | 一种基于层次聚类与k均值算法的气象数据分析方法 |
CN109446243B (zh) * | 2018-11-30 | 2022-03-01 | 国网冀北电力有限公司承德供电公司 | 一种基于大数据分析检测光伏电站发电异常的方法 |
CN110009385B (zh) * | 2019-01-11 | 2023-12-12 | 国网浙江杭州市临安区供电有限公司 | 一种基于多因素映射的光伏发电用户群划分方法 |
CN109871769A (zh) * | 2019-01-18 | 2019-06-11 | 深圳壹账通智能科技有限公司 | 智能伞控制方法、装置、计算机设备及存储介质 |
CN110826623B (zh) * | 2019-11-04 | 2023-09-01 | 深圳雷霆应急科技有限公司 | 基于气象数据的分类方法、装置、计算机设备及存储介质 |
CN112364477B (zh) * | 2020-09-29 | 2022-12-06 | 中国电器科学研究院股份有限公司 | 户外实证预测模型库生成方法及系统 |
CN112987802B (zh) * | 2021-02-22 | 2022-08-09 | 山东理工大学 | 光伏发电方法、装置、电子设备及存储介质 |
CN112925824A (zh) * | 2021-02-25 | 2021-06-08 | 山东大学 | 针对极端天气类型的光伏功率预测方法及系统 |
CN113240153A (zh) * | 2021-04-09 | 2021-08-10 | 水发兴业能源(珠海)有限公司 | 光伏发电数据预测方法、装置、计算设备及存储介质 |
CN113221949B (zh) * | 2021-04-13 | 2024-03-29 | 中国电力科学研究院有限公司 | 一种影响新能源出力的多尺度天气过程分类方法和系统 |
CN112990355A (zh) * | 2021-04-15 | 2021-06-18 | 中科三清科技有限公司 | 污染天气的分型方法、装置、电子设备及存储介质 |
CN116050666B (zh) * | 2023-03-20 | 2023-07-18 | 中国电建集团江西省电力建设有限公司 | 一种辐照特征聚类的光伏发电功率预测方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106022528A (zh) * | 2016-05-26 | 2016-10-12 | 上海电力学院 | 一种基于密度峰值层次聚类的光伏电站短期功率预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014075108A2 (en) * | 2012-11-09 | 2014-05-15 | The Trustees Of Columbia University In The City Of New York | Forecasting system using machine learning and ensemble methods |
-
2017
- 2017-11-10 CN CN201711101360.0A patent/CN107944604B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106022528A (zh) * | 2016-05-26 | 2016-10-12 | 上海电力学院 | 一种基于密度峰值层次聚类的光伏电站短期功率预测方法 |
Non-Patent Citations (1)
Title |
---|
光伏系统中地基云图的预处理;朱想等;《电力系统自动化》;20180325;第42卷(第6期);第140-145页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107944604A (zh) | 2018-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107944604B (zh) | 一种用于光伏功率预测的天气类型识别方法和装置 | |
CN107766990B (zh) | 一种光伏电站发电功率的预测方法 | |
CN111369070B (zh) | 一种基于包络线聚类的多模融合光伏功率预测方法 | |
CN110909919A (zh) | 融合注意力机制的深度神经网络模型的光伏功率预测方法 | |
CN111091139A (zh) | 相似日聚类的光伏预测方法、装置、设备及可读存储介质 | |
CN114004139B (zh) | 一种光伏发电功率预测方法 | |
Kou et al. | Photovoltaic power forecasting based on artificial neural network and meteorological data | |
CN108171379B (zh) | 一种用电负荷预测方法 | |
CN105787594B (zh) | 基于多元时间序列及回归分析的辐照预测方法 | |
CN103473621A (zh) | 风电场短期功率预测方法 | |
CN114792156A (zh) | 基于曲线特征指标聚类的光伏输出功率预测方法和系统 | |
CN113822418A (zh) | 一种风电场功率预测方法、系统、设备和存储介质 | |
CN111697560B (zh) | 一种基于lstm预测电力系统负荷的方法及系统 | |
Varanasi et al. | K-means clustering based photo voltaic power forecasting using artificial neural network, particle swarm optimization and support vector regression | |
CN115186923A (zh) | 光伏发电功率的预测方法、装置及电子设备 | |
CN113837434A (zh) | 太阳能光伏发电预测方法、装置、电子设备和存储介质 | |
CN113111592A (zh) | 一种基于emd-lstm的短期风电功率预测方法 | |
CN115829145A (zh) | 一种光伏发电量预测系统及方法 | |
CN115470862A (zh) | 动态自适应负荷预测模型组合方法 | |
CN115860797A (zh) | 一种适应新电价改革形势的电量需求预测方法 | |
CN111815039A (zh) | 基于天气分类的周尺度风电功率概率预测方法及系统 | |
CN114240687A (zh) | 一种适用于综合能源系统的能源托管效率分析方法 | |
CN115563848A (zh) | 一种基于深度学习的分布式光伏总辐射预测方法及系统 | |
KR20190071174A (ko) | 기압 데이터를 이용한 단기 풍속 예측 방법 및 시스템 | |
CN111340525A (zh) | 一种分时电价尖峰电价的确定方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |