CN106022528A - 一种基于密度峰值层次聚类的光伏电站短期功率预测方法 - Google Patents
一种基于密度峰值层次聚类的光伏电站短期功率预测方法 Download PDFInfo
- Publication number
- CN106022528A CN106022528A CN201610357524.5A CN201610357524A CN106022528A CN 106022528 A CN106022528 A CN 106022528A CN 201610357524 A CN201610357524 A CN 201610357524A CN 106022528 A CN106022528 A CN 106022528A
- Authority
- CN
- China
- Prior art keywords
- day
- prediction
- bunch
- cluster
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000012512 characterization method Methods 0.000 claims description 36
- 238000012549 training Methods 0.000 claims description 21
- 230000003203 everyday effect Effects 0.000 claims description 19
- 239000000203 mixture Substances 0.000 claims description 15
- 238000010586 diagram Methods 0.000 claims description 9
- 238000013075 data extraction Methods 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 6
- 230000001174 ascending effect Effects 0.000 claims description 3
- 230000001537 neural effect Effects 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 2
- 230000008859 change Effects 0.000 description 10
- 238000011156 evaluation Methods 0.000 description 9
- 238000009826 distribution Methods 0.000 description 8
- 238000002790 cross-validation Methods 0.000 description 3
- 238000003064 k means clustering Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000002354 daily effect Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000011056 performance test Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/231—Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Primary Health Care (AREA)
- Entrepreneurship & Innovation (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于密度峰值层次聚类的光伏电站短期功率预测方法,该方法包括如下步骤:(A)获取预测日气象数据、用于天气类型识别的SVM识别模型以及对应不同天气类型的功率预测模型;(B)根据预测日气象数据,利用SVM识别模型进行逐层识别,确定预测日所属天气类型;(C)将预测日的气象数据作为对应天气类型的功率预测模型的输入,并输出预测日对应的功率预测值;其中,SVM识别模型以及功率预测模型具体通过下述方式获得:对历史日气象数据进行分层聚类形成分别对应一种天气类型的K个簇类集,进而建立用于识别天气类型的SVM识别模型,同时建立基于该天气类型的功率预测模型。与现有技术相比,本发明具有预测精度高等优点。
Description
技术领域
本发明涉及一种光伏电站短期功率预测方法,尤其是涉及一种基于密度峰值层次聚类的光伏电站短期功率预测方法。
背景技术
近年来随着经济发展,能源短缺与环境污染两大难题日益突出,而这两大问题主要是因为化石能源的消耗与大量使用引起的,因而发展清洁、高效、无污染的能源成为解决这两大难题最有效的途径。太阳能是一种自然资源,具有时间周期性和邻近相似性,同时受到温度、湿度、风速和云量等因素的影响,又有很强的随机突变性。而光伏发电系统的输出功率主要受到太阳辐射等变化的影响,其随机波动性会对电网造成冲击,对电力系统的功率平衡和安全运行带来挑战。因此,研究光伏电站短期出力的准确预测方法具有重要意义。
目前光伏电站短期功率预测的方法主要有基于人工智能方法和数学统计预测方法,基本依靠数值天气预报和卫星观测云图。其预测模型大致分为单一预测模型和组合预测模型。大多预测方法采用的历史气象数据是建立在已知气象类型的情况下。但由于历史采集数据可能会有某些类型标签的缺失,从而导致预测精度较低。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种提高功率预测的精度的基于密度峰值层次聚类的光伏电站短期功率预测方法。
本发明的目的可以通过以下技术方案来实现:
一种基于密度峰值层次聚类的光伏电站短期功率预测方法,该方法包括如下步骤:
(A)获取预测日气象数据、用于天气类型逐层识别的SVM识别模型以及对应不同天气类型的功率预测模型;
(B)根据预测日气象数据,利用相应的SVM识别模型进行逐层识别,确定预测日所属天气类型;
(C)将预测日的气象数据作为对应天气类型下的功率预测模型的输入,功率预测模型输出预测日对应的功率预测值;
其中,用于天气类型识别的SVM识别模型以及对应不同天气类型的功率预测模型具体通过下述步骤获得:
(1)获取历史日气象数据;
(2)确定分层聚类的层数,获取相应层的分层特征因子,对历史日气象数据按照每层对应的特征因子进行分层聚类,将历史日气象数据分成K个簇类集,每个簇类集对应一种天气类型;
(3)分别建立用于识别不同天气类型对应的簇类集的SVM识别模型;
(4)对不同的天气类型,分别提取对应的簇类集中包含的历史日的气象数据和功率数据进行神经网络训练,建立基于该天气类型的功率预测模型。
步骤(2)具体包括以下步骤:
(201)确定分层聚类层数为2层,分别为顶层聚类和底层聚类;
(202)获取顶层聚类的特征因子,组成顶层特征因子向量,分别获取每个历史日相应的特征因子向量,并组成数据集X;
其中,所述的顶层聚类的特征因子为6维特征因子,分别为每日温度最大值Tmax、每日湿度最大值Hmax、每日能见度最大值Wmax、每日辐照度最大值Gmax、每日实时风速与日平均风速差的3阶导数最大值Vd″′以及每日辐照度3阶导数最大值Gd″′,进而顶层特征因子向量为F1=[Tmax,Hmax,Wmax,Gmax,Vd″′,Gd″′];
(203)对数据集X进行顶层聚类,得到簇类数为2,进而将数据集X划分为2个顶层簇类集,根据历史日中部分已知的天气类型,确定2个顶层簇类数据集对应的天气类型,分别为晴天簇类集和阴雨天簇类集;
(204)获取底层聚类的特征因子,组成底层特征因子向量,提取阴雨天簇类集对应的历史日的底层特征因子向量,并组成数据集Y;
其中,所述的顶层聚类的特征因子为4维特征因子,分别为每日能见度最大值Wmax、每日能见度3阶导数最大值Wd″′、每日辐照度最大值Gmax以及每日辐照度3阶导数最大值Gd″′,进而底层特征因子向量为F2=[Wmax,Wd″′,Gmax,Gd″′];
(205)对数据集Y进行底层聚类,得到簇类数为3,进而将数据集Y划分为3个底层簇类集,根据历史日中部分已知的天气类型,确定3个底层簇类集对应的天气类型,分别为阴天簇类集、小雨簇类集和大雨簇类集。
步骤(203)中的顶层聚类和步骤(205)中的底层聚类均通过下述方式实现:
(a)设待聚类的数据集为n个待分类样本的集合S:S={x1,x2,···,xn},集合中各样本为对应的待聚类历史日对应的特征因子向量;
(b)分别求取集合S中的第i个特征因子向量xi和第j个特征因子向量xj之间采用欧式距离dij:
其中i=1,2……n,j=1,2……n,k为特征因子向量中的第k个元素,m为特征因子向量元素总个数,表示第i个特征因子向量中的第k个元素;
(c)对个欧式距离dij进行升序排列,得到d1≤d2≤…≤dM,获取截断距离dc=dt,其中t=[2%·M],[]表示取整;
(d)求取第i个特征因子向量xi对应的局部密度ρi:
其中i=1,2……n,Is={1,2…n},j∈Is,j≠i表示j的取值为集合Is中不等于i的其余所有元素值;
(e)将ρi进行降序排列:
将降序排列后的序列各局部密度对应的下标数值依次记作q1,q2,…,qn;
(f)根据下式求取对应的特征因子向量距离:
(g)获取第i个特征因子向量xi对应的参数(ρi,δi),绘制2维坐标决策图,其中横轴表示局部密度ρi,纵轴表示距离δi;
(h)根据2维坐标决策图确定聚类中心点,进而确定簇类数,簇类数等于聚类中心点个数。
所述的步骤(3)中具体为:
采用全部历史日对应的顶层聚类的特征因子组成训练样本,建立用于识别晴天和阴雨天的SVM识别模型MAB;
采用阴雨天簇类集中包含的所有历史日对应的底层聚类的特征因子组成训练样本,建立用于识别阴天和雨天的SVM识别模型MB1B2;
采用小雨簇类集和大雨簇类集中包含的所有历史日对应的底层聚类的特征因子组成训练样本,建立用于识别大雨和小雨的SVM识别模型MB21B22。
所述的步骤(B)具体为:
(B1)根据预测日气象数据提取预测日对应的顶层聚类的特征因子,采用SVM识别模型MAB进行识别,若识别为晴天则确定预测日天气类型为晴天,并结束,否则执行步骤(B2);
(B2)根据预测日气象数据提取预测日对应的底层聚类的特征因子,采用SVM识别模型MB1B2进行识别,若识别为阴天则确定预测日天气类型为阴天,并结束,否则执行步骤(B3);
(B3)继续采用预测日对应的底层聚类的特征因子,采用SVM识别模型MB21B22进行识别,确定预测日天气类型为小雨或大雨。
与现有技术相比,本发明具有如下优点:
(1)本发明采用分层聚类的方法,通过不同天气类型对应的特征因子的不同,采用不同的特征因子进行顶层聚类和底层聚类,进而提高了预测日天气类型预测的精度,从而有利于提高不完整数据情况下功率预测的精度;
(2)本发明的SVM识别模型是针对不同天气类型建立的SVM模型,识别精度高,进一步提高功率预测的准确性。
附图说明
图1为本发明基于密度峰值层次聚类的光伏电站短期功率预测方法的结构框图;
图2为晴天和阴雨天五种气象特征每小时平均值曲线分布图;
图3为阴天、小雨和大雨天气类型下能见度和辐照度每小时平均值曲线分布图;
图4为晴天-阴雨天的顶层聚类决策图;
图5为晴天-阴雨天的顶层聚类分布图;
图6为阴天-小雨-大雨的底层聚类决策图;
图7为阴天-小雨-大雨综合评价指标分布图;
图8为阴天-小雨-大雨的底层聚类分布图;
图9为采用的基于密度峰值层次聚类的光伏电站短期功率预测方法后的功率预测曲线图;
图10为采用传统的K-means聚类算法后的功率预测曲线图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
实施例
如图1所述为本发明基于密度峰值层次聚类的光伏电站短期功率预测方法的结构框图。本发明首先要建立用于天气类型识别的SVM识别模型以及对应不同天气类型的功率预测模型,具体通过下述步骤获得,如图1中所示:
执行步骤1:获取历史日气象数据;
步骤2:确定分层聚类的层数,获取相应层的分层特征因子;
步骤3:对历史日气象数据按照每层对应的特征因子进行分层聚类,将历史日气象数据分成K个簇类集,每个簇类集对应一种天气类型,本发明分层聚类层数为2层,分别为顶层聚类和底层聚类,每一层采用不同的特征因子进行分层聚类;
步骤4:分别建立用于识别不同天气类型对应的簇类集的SVM识别模型;
步骤5:对不同的天气类型,分别提取对应的簇类集中包含的历史日的气象数据和功率数据进行神经网络训练,建立基于该天气类型的功率预测模型;
然后执行步骤6:获取预测日气象数据,根据预测日气象数据,利用相应的SVM识别模型进行逐层识别,确定预测日所属天气类型;
最后执行步骤7:将预测日的气象数据作为对应天气类型下的功率预测模型的输入,功率预测模型输出预测日对应的功率预测值。
本实施例中,选用上海地区的光伏电站2015年春季(3月~5月)共92个历史日作为样本数据,将天气类型划分为晴天、阴天、小雨和大雨共4类。在同一季节范围内,不同的天气类型,其气象因子的影响权重具有显著的差别。晴天与阴雨天的温度、湿度、辐照度差别最为明显,对于阴天和雨天,其温度、辐照度均有所下降,湿度也增加,故不能采用相同的气象特征因子对阴雨天气进行划分。为了获取用于聚类的特征因子,对其特征规律进行分析,采用已知气象类型的历史日的气象数据,画出5种气象特征温度、湿度、风速、能见度和辐照度在不同天气类型下的每小时平均值。如图2所示,为晴天和阴雨天五种气象特征每小时平均值曲线分布图,可见,阴天、小雨和大雨3类曲线特征较为接近,均与晴天存在较大的区别。其中:晴天的温度、能见度和辐照度均明显高于阴雨类型,湿度则与阴雨类型成反比,风速呈现平稳变化,而阴雨天则波动范围较为明显,故风速的波动变化是区别于晴天与阴雨天的关键特征。由此可得,晴天-阴雨天的气象特征因子(即温度、湿度、风速、能见度和辐照度)。图3为阴天、小雨和大雨天气类型下能见度和辐照度每小时平均值曲线分布图,故能见度、辐照度2种特征因子可作为区分天气类型的重要因素。
经过气象特征分析可知,导数应能够反映风速数据随机变化的局部特征,因采样数据为离散,故实际导数为差分;由于太阳辐照度对于天气类型起决定作用,所以考虑日实时辐照度与平均辐照度差3阶导数。因此取每日温度最大值Tmax、每日湿度最大值Hmax、每日能见度最大值Wmax、每日辐照度最大值Gmax、每日实时风速与日平均风速差的3阶导数最大值Vd″′以及每日辐照度3阶导数最大值Gd″′共6维特征因子实现对气象类型的顶层聚类,即:
F1=[Tmax,Hmax,Wmax,Gmax,Vd″′,Gd″′]
每日能见度最大值Wmax、每日能见度3阶导数最大值Wd″′、每日辐照度最大值Gmax以及每日辐照度3阶导数最大值Gd″′共4维特征因子实现底层聚类,即:
F2=[Wmax,Wd″′,Gmax,Gd″′]。
步骤2具体包括以下步骤:
(201)确定分层聚类层数为2层,分别为顶层聚类和底层聚类;
(202)获取顶层聚类的特征因子,组成顶层特征因子向量,分别获取每个历史日相应的特征因子向量,并组成数据集X;
(203)对数据集X进行顶层聚类,得到簇类数为2,进而将数据集X划分为2个顶层簇类集,根据历史日中部分已知的天气类型,确定2个顶层簇类数据集对应的天气类型,分别为晴天簇类集和阴雨天簇类集;
(204)获取底层聚类的特征因子,组成底层特征因子向量,提取阴雨天簇类集对应的历史日的底层特征因子向量,并组成数据集Y;
(205)对数据集Y进行底层聚类,得到簇类数为3,进而将数据集Y划分为3个底层簇类集,根据历史日中部分已知的天气类型,确定3个底层簇类集对应的天气类型,分别为阴天簇类集、小雨簇类集和大雨簇类集。
步骤(203)中的顶层聚类和步骤(205)中的底层聚类均通过下述方式实现:
(a)设待聚类的数据集为n个待分类样本的集合S:S={x1,x2,···,xn},集合中各样本为对应的待聚类历史日对应的特征因子向量;
(b)分别求取集合S中的第i个特征因子向量xi和第j个特征因子向量xj之间采用欧式距离dij:
其中i=1,2……n,j=1,2……n,k为特征因子向量中的第k个元素,m为特征因子向量元素总个数,表示第i个特征因子向量中的第k个元素;
(c)对个欧式距离dij进行升序排列,得到d1≤d2≤…≤dM,获取截断距离dc=dt,其中t=[2%·M],[]表示取整;
(d)求取第i个特征因子向量xi对应的局部密度ρi:
其中i=1,2……n,Is={1,2…n},j∈Is,j≠i表示j的取值为集合Is中不等于i的其余所有元素值;
(e)将ρi进行降序排列:
将降序排列后的序列各局部密度对应的下标数值依次记作q1,q2,…,qn;
(f)根据下式求取对应的特征因子向量距离:
(g)获取第i个特征因子向量xi对应的参数(ρi,δi),绘制2维坐标决策图,其中横轴表示局部密度ρi,纵轴表示距离δi;
(h)根据2维坐标决策图确定聚类中心点,进而确定簇类数,簇类数等于聚类中心点个数。
具体地,利用92个历史日的气象数据,首先提取92个历史日气象数据的顶层聚类特征因子进行顶层聚类,得到2维坐标决策图,即晴天-阴雨天顶层决策图,如图4所示。由图可见,右上方2个点同时具有较大的局部密度值ρ和距离值δ,它们与其余点分离出来,即可快速得到聚类中心,并确定其簇类数为2,该算法的实现验证了对于气象特征的分析。气象数据的聚类中心和簇类数后,可以得到聚类分布图如图5所示,晴天的数据采样点在2维坐标下表现较为密集,而阴雨天气类型则较为松散。
提取阴雨簇类集对应的取阴雨天簇类集对应的历史日的底层特征因子向量进行底层聚类,得到2为坐标决策图,即阴天-小雨-大雨底层聚类决策图,如图6所示。图中上方3个点为聚类中心,右上角的点具有较大的ρ值和δ值,而偏左方的两个点虽然其ρ较小,但δ值很大,因此考虑综合评价指标,将局部密度ρi和距离δi归一化后得到局部密度归一化参数和距离归一化参数定义
为综合评价指标,其中n1为图5中数据点总个数,将{γ1,γ2,…,γn1}降序排列,以下标为横轴,γ为纵轴作图,如图7所示,因此可得聚类中心点与非聚类中心点之间存在较大的间隔距离。考虑图7所示的综合评价指标γ,即可得到底层聚类中心并确定簇类数为3。图8为阴天-小雨-大雨的底层聚类分布图,图中大雨和小雨的分布比较密集,而阴天则较为松散,这是由于阴天类型包含了较为广泛的突变天气等复杂情况。
聚类完成后,首先将晴天簇类集定义标签为A,阴雨天簇类集为B,采用全部历史日对应的顶层聚类的特征因子组成训练样本,建立用于识别晴天和阴雨天的SVM识别模型MAB;然后将阴雨天分为阴天和雨天两类,定义阴天簇类集为B1,雨天簇类集为B2,采用阴雨天簇类集中包含的所有历史日对应的底层聚类的特征因子组成训练样本,建立用于识别阴天和雨天的SVM识别模型MB1B2;最后将雨天簇类集分为小雨和大雨两类,小雨簇类集定义标签为B21,大雨簇类集定义为B22,采用小雨簇类集和大雨簇类集中包含的所有历史日对应的底层聚类的特征因子组成训练样本,建立用于识别大雨和小雨的SVM识别模型MB21B22。为提高SVM实际分类识别的精度和泛化能力,本专利采用K折交叉验证(k-fold Cross Validation,k-cv)的方法来实现模型的优化。首先将原始数据分为训练样本集和性能测试集两部分;然后再将训练样本集随机地等分为k个子集,每个子集分别做且只做1次校验集,其余k-1个子集作为训练集,交叉验证就是将上述过程重复k次,即为k折,保证每个子集均用作一次校验集。如此利用训练样本集对具有相同结构和参数的一类模型进行k次训练和校验,针对k个训练后的模型进行校验,得到k个误差指标,将这k个误差指标的平均值作为该模型的单一评估指标。通过对具有不同结构和参数的多类模型分别进行k-CV,得到每列模型的评估指标,选择其中评估指标最好的作为选定的预测模型。利用训练样本集所有数据对选定的预测模型进行训练,然后再利用性能测试集对此最终模型进行测试。对于SVM的惩罚参数C和高斯核函数参数σ,C值过小易发生过拟合,太大则增大误差;σ的取值直接影响到最优超平面的确定。因此这里采用网格划分法(Grid Search)来确定最佳参数,以分类误差最小为评价指标,若存在多个误差最小值,则选择C最小的一组参数。相比启发式算法,该算法运算速度快,结构简单。
步骤(5)中对不同的簇类集建立功率预测模型,采用广义径向基(RBF)神经网络实现短期功率预测,包括输入层、隐含层和输出层共3层。训练数据由历史日归一化的气象数据和光伏发电功率实时数据值组成,采样间隔为1hr,从早上5:00~下午18:00共14个采样点。设预测日为t,RBF网络的输入量由气象数据得到,包括预测日最高温度Tmax(t)、最大湿度Hmax(t)、最大能见度Wmax(t)以及14hr辐照度值G1(t)~G14(t)。输出P1(t)~P14(t)为预测日的14hr发电量,其可表达为:
P(t)=f(X(t)),
P(t)=[P1(t),P2(t)…P14(t)],
其中
X(t)=[Tmax(t),Hmax(t),Wmax(t),G(t)],
G(t)=[G1(t),G2(t)…G14(t)],
网络中隐含层激励函数选用高斯核函数为:
径向基神经元数N依据训练数据的类型而定,函数中心ci采用聚类算法选取确定;方差dmax是选取中心点之间的最大距离。
步骤(6)中确定预测日所属天气类型,具体包括:
(601)根据预测日气象数据提取预测日对应的顶层聚类的特征因子,采用SVM识别模型MAB进行识别,若识别为晴天则确定预测日天气类型为晴天,并结束,否则执行步骤(602);
(602)根据预测日气象数据提取预测日对应的底层聚类的特征因子,采用SVM识别模型MB1B2进行识别,若识别为阴天则确定预测日天气类型为阴天,并结束,否则执行步骤(603);
(603)继续采用预测日对应的底层聚类的特征因子,采用SVM识别模型MB21B22进行识别,确定预测日天气类型为小雨簇或大雨。
最后,将预测日的气象数据作为功率预测模型的输入,预测日的气象数据对应包括预测日最高温度Tmax(t)、最大湿度Hmax(t)、最大能见度Wmax(t)以及14hr辐照度值G1(t)~G14(t),将预测日的功率作为功率预测模型的输出,得到预测日的功率预测值。
本实施例选用上海地区的光伏电站,总装机容量30kW,2015年3月到2015年5月底的实际运行数据作为样本建立预测模型,分别在4种不同天气类型下对未来24hr光伏功率进行预测。同时为验证所采用的聚类算法对预测模型的有效性,与传统K-means聚类算法对比。
图9为本实施例采用的基于密度峰值层次聚类的光伏电站短期功率预测方法得到的光伏功率预测曲线图,图10为采用传统的K-means聚类算法后的功率预测曲线图。
为评价预测的精度,预测值与实测值采用平均绝对误差百分比(MAPE)和均方根误差(RMSE)衡量系统的预测性能,它们分别定义为:
式中:Ph(i)为功率预测值,Py(i)为功率实测值;N=24,为一小时采样点个数,MAPE衡量直接预测的误差程度,RMSE则衡量了预测结果的整体精度,结果见表1所示。
表1 预测误差统计指标
从图9、图10和表1的分析可以得出:
(1)晴天条件下辐照度良好,气候平稳,其聚类结果基本一致,两种方法均与实际值接近,其预测误差相对较小;
(2)阴天时实际功率有所下降,波动变化增加,采用传统方法与本文方法相比其聚类精度已有一定程度下降。但从表1中看出,传统方法预测的误差程度在1kW的范围内,整体精度也保持在60%左右,仍能与实际发电功率的变化保持一致;
(3)当在气象状况差的小雨条件下时,辐照度大幅衰减,采用传统聚类方法已不能保证精度,故预测的功率曲线严重偏离实际值,不能够反映实际功率的变化趋势,而采用改进聚类算法的预测曲线虽较晴天和阴天误差有一定程度增加,但依然能够跟随实际发电功率的波动而变化;
(4)在大雨条件下时,因辐照度的严重衰减,造成实际功率曲线的随机性变化增加,降低了相邻日发电功率之间的相似性,增大了预测的难度,导致传统聚类方法的预测值与实际值出现严重偏差,而采用改进的聚类法考虑了雨天条件下的影响因子,减少了特征信息冗余,从而提高了预测精度。
(5)由表1可见,对于反映预测值和实际值的偏离程度RMSE和整体精度MAPE,改进聚类的预测模型均优于传统聚类,即使在复杂的天气状态下误差量较大,但仍能达到发电功率的有效预测。
Claims (5)
1.一种基于密度峰值层次聚类的光伏电站短期功率预测方法,其特征在于,该方法包括如下步骤:
(A)获取预测日气象数据、用于天气类型逐层识别的SVM识别模型以及对应不同天气类型的功率预测模型;
(B)根据预测日气象数据,利用相应的SVM识别模型进行逐层识别,确定预测日所属天气类型;
(C)将预测日的气象数据作为对应天气类型下的功率预测模型的输入,功率预测模型输出预测日对应的功率预测值;
其中,用于天气类型识别的SVM识别模型以及对应不同天气类型的功率预测模型具体通过下述步骤获得:
(1)获取历史日气象数据;
(2)确定分层聚类的层数,获取相应层的分层特征因子,对历史日气象数据按照每层对应的特征因子进行分层聚类,将历史日气象数据分成K个簇类集,每个簇类集对应一种天气类型;
(3)分别建立用于识别不同天气类型对应的簇类集的SVM识别模型;
(4)对不同的天气类型,分别提取对应的簇类集中包含的历史日的气象数据和功率数据进行神经网络训练,建立基于该天气类型的功率预测模型。
2.根据权利要求1所述的一种基于密度峰值层次聚类的光伏电站短期功率预测方法,其特征在于,步骤(2)具体包括以下步骤:
(201)确定分层聚类层数为2层,分别为顶层聚类和底层聚类;
(202)获取顶层聚类的特征因子,组成顶层特征因子向量,分别获取每个历史日相应的特征因子向量,并组成数据集X;
其中,所述的顶层聚类的特征因子为6维特征因子,分别为每日温度最大值Tmax、每日湿度最大值Hmax、每日能见度最大值Wmax、每日辐照度最大值Gmax、每日实时风速与日平均风速差的3阶导数最大值V″′d以及每日辐照度3阶导数最大值G″′d,进而顶层特征因子向量为F1=[Tmax,Hmax,Wmax,Gmax,V″′d,G″′d];
(203)对数据集X进行顶层聚类,得到簇类数为2,进而将数据集X划分为2个顶层簇类集,根据历史日中部分已知的天气类型,确定2个顶层簇类数据集对应的天气类型,分别为晴天簇类集和阴雨天簇类集;
(204)获取底层聚类的特征因子,组成底层特征因子向量,提取阴雨天簇类集对应的历史日的底层特征因子向量,并组成数据集Y;
其中,所述的顶层聚类的特征因子为4维特征因子,分别为每日能见度最大值Wmax、每日能见度3阶导数最大值W″′d、每日辐照度最大值Gmax以及每日辐照度3阶导数最大值G″′d,进而底层特征因子向量为F2=[Wmax,W″′d,Gmax,G″′d];
(205)对数据集Y进行底层聚类,得到簇类数为3,进而将数据集Y划分为3个底层簇类集,根据历史日中部分已知的天气类型,确定3个底层簇类集对应的天气类型,分别为阴天簇类集、小雨簇类集和大雨簇类集。
3.根据权利要求2所述的一种基于密度峰值层次聚类的光伏电站短期功率预测方法,其特征在于,步骤(203)中的顶层聚类和步骤(205)中的底层聚类均通过下述方式实现:
(a)设待聚类的数据集为n个待分类样本的集合S:S={x1,x2,…,xn},集合中各样本为对应的待聚类历史日对应的特征因子向量;
(b)分别求取集合S中的第i个特征因子向量xi和第j个特征因子向量xj之间采用欧式距离dij:
其中i=1,2……n,j=1,2……n,k为特征因子向量中的第k个元素,m为特征因子向量元素总个数,表示第i个特征因子向量中的第k个元素;
(c)对个欧式距离dij进行升序排列,得到d1≤d2≤…≤dM,获取截断距离dc=dt,其中t=[2%·M],[]表示取整;
(d)求取第i个特征因子向量xi对应的局部密度ρi:
其中i=1,2……n,Is={1,2…n},j∈Is,j≠i表示j的取值为集合Is中不等于i的其余所有元素值;
(e)将ρi进行降序排列:
将降序排列后的序列各局部密度对应的下标数值依次记作q1,q2,…,qn;
(f)根据下式求取对应的特征因子向量距离:
(g)获取第i个特征因子向量xi对应的参数(ρi,δi),绘制2维坐标决策图,其中横轴表示局部密度ρi,纵轴表示距离δi;
(h)根据2维坐标决策图确定聚类中心点,进而确定簇类数,簇类数等于聚类中心点个数。
4.根据权利要求2所述的一种基于密度峰值层次聚类的光伏电站短期功率预测方法,其特征在于,所述的步骤(3)中具体为:
采用全部历史日对应的顶层聚类的特征因子组成训练样本,建立用于识别晴天和阴雨天的SVM识别模型MAB;
采用阴雨天簇类集中包含的所有历史日对应的底层聚类的特征因子组成训练样本,建立用于识别阴天和雨天的SVM识别模型MB1B2;
采用小雨簇类集和大雨簇类集中包含的所有历史日对应的底层聚类的特征因子组成训练样本,建立用于识别大雨和小雨的SVM识别模型MB21B22。
5.根据权利要求4所述的一种基于密度峰值层次聚类的光伏电站短期功率预测方法,其特征在于,所述的步骤(B)具体为:
(B1)根据预测日气象数据提取预测日对应的顶层聚类的特征因子,采用SVM识别模型MAB进行识别,若识别为晴天则确定预测日天气类型为晴天,并结束,否则执行步骤(B2);
(B2)根据预测日气象数据提取预测日对应的底层聚类的特征因子,采用SVM识别模型MB1B2进行识别,若识别为阴天则确定预测日天气类型为阴天,并结束,否则执行步骤(B3);
(B3)继续采用预测日对应的底层聚类的特征因子,采用SVM识别模型MB21B22进行识别,确定预测日天气类型为小雨或大雨。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610357524.5A CN106022528B (zh) | 2016-05-26 | 2016-05-26 | 一种基于密度峰值层次聚类的光伏电站短期功率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610357524.5A CN106022528B (zh) | 2016-05-26 | 2016-05-26 | 一种基于密度峰值层次聚类的光伏电站短期功率预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106022528A true CN106022528A (zh) | 2016-10-12 |
CN106022528B CN106022528B (zh) | 2019-06-11 |
Family
ID=57094453
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610357524.5A Active CN106022528B (zh) | 2016-05-26 | 2016-05-26 | 一种基于密度峰值层次聚类的光伏电站短期功率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106022528B (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650784A (zh) * | 2016-11-04 | 2017-05-10 | 许继集团有限公司 | 一种基于特征聚类比较的光伏电站功率预测方法及装置 |
CN106777984A (zh) * | 2016-12-19 | 2017-05-31 | 福州大学 | 一种基于密度聚类算法实现光伏阵列工作状态分析与故障诊断的方法 |
CN107944604A (zh) * | 2017-11-10 | 2018-04-20 | 中国电力科学研究院有限公司 | 一种用于光伏功率预测的天气类型识别方法和装置 |
CN108038518A (zh) * | 2018-01-02 | 2018-05-15 | 华北电力大学(保定) | 一种基于气象数据的光伏发电功率确定方法及系统 |
CN108227041A (zh) * | 2017-12-27 | 2018-06-29 | 中国海洋大学 | 基于站点实测数据和模式结果的水平能见度预报方法 |
CN108846346A (zh) * | 2018-06-06 | 2018-11-20 | 浙江大学 | 基于密度峰值聚类算法的神经元峰电位在线分类方法 |
CN108985965A (zh) * | 2018-06-22 | 2018-12-11 | 华北电力大学 | 一种结合神经网络和参数估计的光伏功率区间预测方法 |
CN109325631A (zh) * | 2018-10-15 | 2019-02-12 | 华中科技大学 | 基于数据挖掘的电动汽车充电负荷预测方法和系统 |
CN109615131A (zh) * | 2018-12-07 | 2019-04-12 | 国能日新科技股份有限公司 | 光伏功率预测方法和装置 |
CN109933040A (zh) * | 2017-12-18 | 2019-06-25 | 中国科学院沈阳自动化研究所 | 基于层次密度峰值聚类和最相似模态的故障监测方法 |
CN110009385A (zh) * | 2019-01-11 | 2019-07-12 | 国网浙江杭州市临安区供电有限公司 | 一种基于多因素映射的光伏发电用户群划分方法 |
CN110188964A (zh) * | 2019-06-06 | 2019-08-30 | 河北工业大学 | 一种基于相关性的光伏出力预测方法 |
CN111445460A (zh) * | 2020-03-30 | 2020-07-24 | 上海眼控科技股份有限公司 | 雷达云图的预测方法、装置、计算机设备和存储介质 |
CN112215383A (zh) * | 2019-07-10 | 2021-01-12 | 中国电力科学研究院有限公司 | 一种分布式光伏发电功率预测方法和系统 |
CN112287990A (zh) * | 2020-10-23 | 2021-01-29 | 杭州卷积云科技有限公司 | 一种基于在线学习的边云协同支持向量机的模型优化方法 |
CN113313298A (zh) * | 2021-05-21 | 2021-08-27 | 上海电力大学 | 一种基于特征选择的混合Kmeans-GRA-SVR光伏发电功率预测方法 |
CN113689057A (zh) * | 2021-10-25 | 2021-11-23 | 广东电网有限责任公司佛山供电局 | 一种光伏发电功率的预测方法及装置 |
CN115146881A (zh) * | 2022-09-05 | 2022-10-04 | 广东电网有限责任公司江门供电局 | 一种低压分布式光伏系统不良数据检测方法和系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239898A (zh) * | 2014-09-05 | 2014-12-24 | 浙江捷尚视觉科技股份有限公司 | 一种快速卡口车辆比对和车型识别方法 |
CN104573879A (zh) * | 2015-01-30 | 2015-04-29 | 河海大学 | 基于最优相似日集的光伏电站出力预测方法 |
CN105184392A (zh) * | 2015-08-21 | 2015-12-23 | 许昌许继软件技术有限公司 | 一种基于最小二乘支持向量机的光伏电站故障诊断方法 |
CN105447509A (zh) * | 2015-11-10 | 2016-03-30 | 天津大学 | 一种光伏发电系统的短期功率预测方法 |
-
2016
- 2016-05-26 CN CN201610357524.5A patent/CN106022528B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239898A (zh) * | 2014-09-05 | 2014-12-24 | 浙江捷尚视觉科技股份有限公司 | 一种快速卡口车辆比对和车型识别方法 |
CN104573879A (zh) * | 2015-01-30 | 2015-04-29 | 河海大学 | 基于最优相似日集的光伏电站出力预测方法 |
CN105184392A (zh) * | 2015-08-21 | 2015-12-23 | 许昌许继软件技术有限公司 | 一种基于最小二乘支持向量机的光伏电站故障诊断方法 |
CN105447509A (zh) * | 2015-11-10 | 2016-03-30 | 天津大学 | 一种光伏发电系统的短期功率预测方法 |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650784A (zh) * | 2016-11-04 | 2017-05-10 | 许继集团有限公司 | 一种基于特征聚类比较的光伏电站功率预测方法及装置 |
CN106777984B (zh) * | 2016-12-19 | 2019-02-22 | 福州大学 | 一种基于密度聚类算法实现光伏阵列工作状态分析与故障诊断的方法 |
CN106777984A (zh) * | 2016-12-19 | 2017-05-31 | 福州大学 | 一种基于密度聚类算法实现光伏阵列工作状态分析与故障诊断的方法 |
CN107944604A (zh) * | 2017-11-10 | 2018-04-20 | 中国电力科学研究院有限公司 | 一种用于光伏功率预测的天气类型识别方法和装置 |
CN107944604B (zh) * | 2017-11-10 | 2022-11-25 | 中国电力科学研究院有限公司 | 一种用于光伏功率预测的天气类型识别方法和装置 |
CN109933040A (zh) * | 2017-12-18 | 2019-06-25 | 中国科学院沈阳自动化研究所 | 基于层次密度峰值聚类和最相似模态的故障监测方法 |
CN109933040B (zh) * | 2017-12-18 | 2020-08-07 | 中国科学院沈阳自动化研究所 | 基于层次密度峰值聚类和最相似模态的故障监测方法 |
CN108227041B (zh) * | 2017-12-27 | 2020-04-28 | 中国海洋大学 | 基于站点实测数据和模式结果的水平能见度预报方法 |
CN108227041A (zh) * | 2017-12-27 | 2018-06-29 | 中国海洋大学 | 基于站点实测数据和模式结果的水平能见度预报方法 |
CN108038518A (zh) * | 2018-01-02 | 2018-05-15 | 华北电力大学(保定) | 一种基于气象数据的光伏发电功率确定方法及系统 |
CN108846346A (zh) * | 2018-06-06 | 2018-11-20 | 浙江大学 | 基于密度峰值聚类算法的神经元峰电位在线分类方法 |
CN108985965A (zh) * | 2018-06-22 | 2018-12-11 | 华北电力大学 | 一种结合神经网络和参数估计的光伏功率区间预测方法 |
CN109325631A (zh) * | 2018-10-15 | 2019-02-12 | 华中科技大学 | 基于数据挖掘的电动汽车充电负荷预测方法和系统 |
CN109615131A (zh) * | 2018-12-07 | 2019-04-12 | 国能日新科技股份有限公司 | 光伏功率预测方法和装置 |
CN110009385B (zh) * | 2019-01-11 | 2023-12-12 | 国网浙江杭州市临安区供电有限公司 | 一种基于多因素映射的光伏发电用户群划分方法 |
CN110009385A (zh) * | 2019-01-11 | 2019-07-12 | 国网浙江杭州市临安区供电有限公司 | 一种基于多因素映射的光伏发电用户群划分方法 |
CN110188964A (zh) * | 2019-06-06 | 2019-08-30 | 河北工业大学 | 一种基于相关性的光伏出力预测方法 |
CN112215383A (zh) * | 2019-07-10 | 2021-01-12 | 中国电力科学研究院有限公司 | 一种分布式光伏发电功率预测方法和系统 |
CN111445460A (zh) * | 2020-03-30 | 2020-07-24 | 上海眼控科技股份有限公司 | 雷达云图的预测方法、装置、计算机设备和存储介质 |
CN112287990A (zh) * | 2020-10-23 | 2021-01-29 | 杭州卷积云科技有限公司 | 一种基于在线学习的边云协同支持向量机的模型优化方法 |
CN113313298A (zh) * | 2021-05-21 | 2021-08-27 | 上海电力大学 | 一种基于特征选择的混合Kmeans-GRA-SVR光伏发电功率预测方法 |
CN113689057A (zh) * | 2021-10-25 | 2021-11-23 | 广东电网有限责任公司佛山供电局 | 一种光伏发电功率的预测方法及装置 |
CN115146881A (zh) * | 2022-09-05 | 2022-10-04 | 广东电网有限责任公司江门供电局 | 一种低压分布式光伏系统不良数据检测方法和系统 |
CN115146881B (zh) * | 2022-09-05 | 2023-01-13 | 广东电网有限责任公司江门供电局 | 一种低压分布式光伏系统不良数据检测方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN106022528B (zh) | 2019-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106022528A (zh) | 一种基于密度峰值层次聚类的光伏电站短期功率预测方法 | |
CN110503245B (zh) | 一种机场航班大面积延误风险的预测方法 | |
CN111369070B (zh) | 一种基于包络线聚类的多模融合光伏功率预测方法 | |
CN102184337B (zh) | 一种受气象信息影响的新能源发电能力动态组合分析方法 | |
CN109165774A (zh) | 一种短期光伏功率预测方法 | |
CN106251001A (zh) | 一种基于改进模糊聚类算法的光伏功率预测方法 | |
CN109146161A (zh) | 融合栈式自编码和支持向量回归的pm2.5浓度预测方法 | |
CN106777984A (zh) | 一种基于密度聚类算法实现光伏阵列工作状态分析与故障诊断的方法 | |
CN103488869A (zh) | 一种最小二乘支持向量机的风力发电短期负荷预测方法 | |
CN107516145A (zh) | 一种基于加权欧氏距离模式分类的多通道光伏出力预测方法 | |
CN112613536B (zh) | 一种基于smote和深度学习的近红外光谱柴油牌号识别方法 | |
WO2024051524A1 (zh) | 一种水风光发电功率联合预测方法、装置 | |
CN107748940B (zh) | 一种节电潜力量化预测方法 | |
CN113987912A (zh) | 一种基于地理信息的污染物在线监测系统 | |
CN113762387B (zh) | 一种基于混合模型预测的数据中心站多元负荷预测方法 | |
CN106600046A (zh) | 基于多分类器融合的土地闲置预测方法及装置 | |
CN110738232A (zh) | 一种基于数据挖掘技术的电网电压越限成因诊断方法 | |
CN105678406A (zh) | 一种基于云模型的短期负荷预测方法 | |
CN106919645A (zh) | 复杂地貌大景区的景点气象要素智能精细预测方法 | |
CN116050666B (zh) | 一种辐照特征聚类的光伏发电功率预测方法 | |
CN115759389A (zh) | 基于天气类型的相似日组合策略的日前光伏功率预测方法 | |
Zang et al. | Combined empirical and machine learning modeling method for estimation of daily global solar radiation for general meteorological observation stations | |
CN104915727B (zh) | 多维度同构异质bp神经网络光功率超短期预测方法 | |
CN114240003A (zh) | 一种新能源出力预测方法、系统、存储介质及设备 | |
CN106886564A (zh) | 一种基于空间聚类订正nwp风能图谱的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |