CN115310711B - 一种新能源光伏发电功率预测方法 - Google Patents
一种新能源光伏发电功率预测方法 Download PDFInfo
- Publication number
- CN115310711B CN115310711B CN202211014009.9A CN202211014009A CN115310711B CN 115310711 B CN115310711 B CN 115310711B CN 202211014009 A CN202211014009 A CN 202211014009A CN 115310711 B CN115310711 B CN 115310711B
- Authority
- CN
- China
- Prior art keywords
- data
- photovoltaic power
- value
- core
- density
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000010248 power generation Methods 0.000 title claims abstract description 39
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 31
- 238000012549 training Methods 0.000 claims abstract description 9
- 239000011159 matrix material Substances 0.000 claims description 27
- 238000010606 normalization Methods 0.000 claims description 14
- 239000013598 vector Substances 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 10
- 239000002245 particle Substances 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 8
- 102220486681 Putative uncharacterized protein PRO1854_S10A_mutation Human genes 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 230000000739 chaotic effect Effects 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 abstract description 4
- 230000010365 information processing Effects 0.000 abstract description 2
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000002411 adverse Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/08—Computing arrangements based on specific mathematical models using chaos models or non-linear system models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/004—Generation forecast, e.g. methods or systems for forecasting future energy generation
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/38—Arrangements for parallely feeding a single network by two or more generators, converters or transformers
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2300/00—Systems for supplying or distributing electric power characterised by decentralized, dispersed, or local generation
- H02J2300/20—The dispersed energy generation being of renewable origin
- H02J2300/22—The renewable source being solar energy
- H02J2300/24—The renewable source being solar energy of photovoltaic origin
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Computational Linguistics (AREA)
- Power Engineering (AREA)
- Biophysics (AREA)
- Tourism & Hospitality (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Quality & Reliability (AREA)
- Primary Health Care (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Operations Research (AREA)
- Nonlinear Science (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
Abstract
本发明公开了一种新能源光伏发电功率预测方法,涉及电力系统光伏发电功率预测技术领域。该新能源光伏发电功率预测方法实施的基于变分模态分解与TPA‑TCN网络的光伏功率预测方法,根据历史数据样本,通过信息处理模块生成训练样本,将该训练样本通过TPA‑TCN预测模型,不断迭代训练,直到精度达到期望值,保留该模型。该新能源光伏发电功率预测方法通过VMD分解降低时间序列的不稳定性与波动性,并且通过相似日法对相似的天气进行归类,从而能够使得神经网络更容易学习到其潜在规律。该方法基于时间模式注意力机制,能够充分提取多因素时序数列中之间的隐含关系,并给予TCN网络最合理的隐藏层权值,从而大大提高预测精度。
Description
技术领域
本发明涉及电力系统光伏发电功率预测技术领域,具体为一种新能源光伏发电功率预测方法。
背景技术
大量的光伏发电站接入配电网,其供电能力的不确定性会对电网规划造成不利影响,因此精准的光伏发电预测成为了电网平稳运行的重要前提,也是后续电网系统进行调控与调度的基石。精确的光伏发电功率预测可以使得电网更加合理地规划供电需求,维护电网的稳定性,降低社会用电成本。然而,光伏发电受气象因素影响较大,具有间歇性和较强的波动性,给接入电网带来了不确定因素。过大的预测误差会使得电网和居民遭受不必要地损失,并可能会产生区域性断电,如何高效地消纳光伏发电以及合理地进行电网供电调度成为了需要解决的问题。
电力系统的中长期规划、电网设计以及实现都会涉及到负荷预测的问题,对光伏发电的精确预测有利于电力部门进行合理的规划,提高电力利用率,保障用电安全,降低电网运行成本。光伏发电作为国家新能源战略的重要一环,其系统稳定的运行与保障也是对新能源广泛开发与使用的重大推力。因此,加强在光伏发电功率预测方面的研究对于解决光伏产业发展所带来的问题意义重大。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种新能源光伏发电功率预测方法,解决了以下技术问题:
1、光伏发电受气象因素影响较大,具有间歇性和较强的波动性,给接入电网带来了不确定因素,过大的预测误差会使得电网和居民遭受不必要地损失,并可能会产生区域性断电的;
2、如何高效地消纳光伏发电以及合理地进行电网供电调度。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种新能源光伏发电功率预测方法,包括如下步骤:
1)数据预处理。将原始的光伏发电数据和气象数据导入,使用DBSCAN聚类算法进行异常筛选,然后补全缺失值和修正异常值;由于数据存在不同量纲,为了尽量消除量纲对训练的影响,对数据进行归一化处理,提高数据集质量,加快算法的收敛速度,也能够改善最终的预测精度。
2)气象因素筛选。计算气象因素与其所对应的光伏发电功率的相关性系数,选择相关性系数较高的气象因素作为预测时的协变量。
3)通过相似日算法,将原始数据集中的光伏功率数据以及其对应的气象因素建立相似日数据集。
4)原始数据分解并计算模态分量与气象信息的相关度。将光伏功率数据VMD分解,在分解过程中通过中心频率观察法确定VMD分解的模态数量,利用基于残差指标最小化的算法来确定VMD中的其他参数值,分解之后得到K个中心频率不同的模态分量,将得到的模态分量与气象因素使用Spearman系数和最大互信息系数对模态分量与气象因素之间关系进行评估。将与气象因素相关度较高的模态分量重新整合成新的多维数据集,其他分量则保持原样,并将数据集划分成测试集和训练集。
5)输入模型进行运算。将包含气象因素的数据集送入支持多变量预测的多维度TCN模型,得到隐藏状态向量Ht-w,Ht-w+1,...,Ht,并输入进TPA层,TPA层通过计算获得注意力向量vt,与隐藏状态向量进行线性映射相加后得到IMF2的预测值;其余数据集则通过单维TCN网络进行预测。将所有的输出结果求和重构,进行反归一化,得到预测值。
具体步骤如下:
S1:数据预处理:
将原始的光伏发电数据和气象数据导入,使用DBSCAN聚类算法进行异常筛选,然后补全缺失值和修正异常值;
S2:气象因素筛选:
计算气象因素与其所对应的光伏发电功率的相关性系数,选择相关性系数较高的气象因素作为预测时的协变量;
S3:通过相似日算法,将原始数据集中的光伏功率数据以及其对应的气象因素建立相似日数据集;
S4:原始数据分解并计算模态分量与气象信息的相关度:
将光伏功率数据VMD分解,在分解过程中通过中心频率观察法确定VMD分解的模态数量,利用基于残差指标最小化的算法来确定VMD中的其他参数值,分解之后得到K个中心频率不同的模态分量,将得到的模态分量与气象因素使用Spearman系数和最大互信息系数对模态分量与气象因素之间关系进行评估;
将与气象因素相关度较高的模态分量重新整合成新的多维数据集,其他分量则保持原样,并将数据集划分成测试集和训练集;
S5:输入模型进行运算:
将包含气象因素的数据集送入支持多变量预测的多维度TCN模型,得到隐藏状态向量Ht-w,Ht-w+1,...,Ht,并输入进TPA层,TPA层通过计算获得注意力向量vt,与隐藏状态向量进行线性映射相加后得到IMF2的预测值;
其余数据集则通过单维TCN网络进行预测;
将所有的输出结果求和重构,进行反归一化,得到预测值。
优选的,所述VMD分解的参数确定方法包括如下步骤:
S41:VMD分解初始参数有模态数量K,惩罚因子α、收敛条件ε以及保真度系数τ,初始参数选择合适与否决定了数据分解质量;
其中模态分量K通过中心频率观察法确定,惩罚因子α、以及保真度系数τ通过残差指标最小化算法确定,收敛条件ε则取普遍值,即为ε=10-7;
S42:中心频率观察法即为从较小的K值开始选取,然后进行数据分解,观察其数据的中心频率,若中心频率有所重叠则增加K值,重复以上步骤,直到观察到不重叠且不相近的中心频率,此时K值即为后续实验所选取的K值;
残差指标最小化算法计算过程如下:
其中,N为待分解数列长度;x(t)为待分解数列;uk(t)表示取不同的惩罚因子α和保真度系数τ时产生的模态分量。
优选的,使用DBSCAN聚类算法进行数据聚类,DBSCAN的聚类即为一个从密度可达关系延展出最大密度相连的集合,利用minPts和ε两个参数,将样本集分为核心点、边缘点和离群点三种;
其中在邻域半径内点的数量大于minPts的成为核心点,非核心点且在某个核心点邻域内的点成为边缘点,非以上两种类型的点被称为离群点,在进行合适的参数调整之后即可找到离群点,即为异常值;
假设样本集为D=(x1,x2,...,xn),使用DBSCAN进行密度描述的定义如下:
邻域:以选定目标为中心,半径为ε的区域即为该目标的邻域;
核心对象:若选定的目标指定邻域内的样本数量大于minPts,则称该对象为核心对象;
密度直达:在样本集D中,若点m在核心对象n的ε邻域内部,则称点m从点n直接密度可达;
密度可达:在样本集D中,对于xi和xj,若存在序列点p1,p2,...,pt,满足p1=xi,pt=xj,且pt+1可由pt密度直达,则称xj从xi密度可达;
密度相连:在样本集D中,若存在点o到点m和点n都密度可达,则称m、n密度相连;
非密度相连:没有密度相连关系的两个点,即为非密度相连关系;
通过样本值的均值、中位数进行异常数据的填充,通过异常数据cx周围的值c0,c1,...,c8来对其进行估算:
其中,权重ω与邻点和目标的距离成反比:
通过计算不同样本之间的距离,获得距离矩阵di={|ci-cx|}然后计算权重矩阵ω,最后通过下式计算估计值;
其中xi表示最近邻相应位置上的数值,K值通过交叉预测结果确定。
优选的,所述归一化处理为:
数据异常处理后,通过使数据集合矩阵D,/>经归一化处理后变为矩阵/>归一化处理后负荷数据值均在0~1之间,矩阵D为原始数据矩阵,矩阵DN为进行归一化处理后的数据矩阵;
其中,Dn,i为第n天第i时刻的光伏功率数据,表示第n天第i时刻的进行归一化处理后光伏功率数据,n∈[1,365]为一年中的天数,i∈[1,24]为一天中的小时数,min{D}为数据集最小值,max{D}为数据集最大值,max{D}-min{D}为数据集极值之差。
优选的,假设通过TCN网络产生的隐藏层信息为H={ht-ω,ht-ω+1,...,ht-1},其中ht为第t个时刻的隐藏层信息;ω则代表用于选取一定长度的时间数据的时间滑动窗口的长度;T表示时间注意力机制所关心的时间长度,一般情况下与窗口滑动长度相等;
使用k个卷积核,对原始隐藏层信息H进行卷积操作,产生一个n*k维的矩阵:
对于接下来预测的ht,通过其与之间的运算,计算出权重αi,其表示了/>中每行对于即将预测的ht的影响强度,即每个时间序列对于ht的影响大小,Wα∈Rk×m,计算过程如下:
其中,表示HC中第i行的向量;
然后进行加权求和,vt代表了所有行对于ht的综合影响,也就是时间方面的影响力:/>最后在运算中添加vt的因素,最终得到预测值:ht'=Whht+Wvvt。
优选的,所述相似日算法包括如下步骤:
S31:计算预测日和预测日所属天气类型的光伏发电功率历史数据集内所有样本有关其所有气象因素的曼哈顿距离:
其中di为所有气象因素之间的曼哈顿距离;n为气象因素个数;Yj为各个气象因素指标;Xij为与预测日天气雷翔相同的光伏发电功率历史数据集合中的第i个数据样本;m为该集合中的样本数目;
S32:选取D={d1,d2,d3,...,dm}中的最小值,该值对应的日期即为预测日的相似日。
优选的,所述DBSCAN聚类算法的流程如下:
S1A:输入领域阈值Eps和密度阈值MinPts;
S2A:遍历数据集,标记处所有核心对象;
S3A:判断是否已被聚类标记,如被聚类标记则进入S2A,如未被聚类标记则进入S4A;
S4A:将某核心对象Eps邻域内的核心点集合,归为一类,并标记该核心点;
S5A:标记该核心点集合的Eps邻域内的核心点,并归为同一类;
S6A:遍历当前类所有核心对象,并标记;
S7A:判断遍历该聚类核心对象是否完成,如完成则进入S8A,如未完成则进入S5A;
S8A:聚类完成;
S9A:判断遍历数据集是否完成,如完成则进入S10A,如未完成则进入S2A;
S10A:输出所有聚类、核心点、边界点及离群点。
优选的,采用改进的混沌蝗虫优化算法对minREI函数求解,具体步骤为:
S421:根据VMD分解确定模态数量K;
S422:根据模态数量K,确定粒子即参数(α,τ)的位置,对原始信号进行VMD分解,计算分解出的模态分量适应度,保存全局最优位置;
S423:更新粒子的递减系数和位置信息,计算新的适应度,更新粒子的全局最优位置;
S424:利用混沌优化算法寻找全局最优解;
S425:重复步骤S423和步骤S424,直到满足条件,结束循环。
(三)有益效果
本发明提供了一种新能源光伏发电功率预测方法。具备以下有益效果:
(1)、该新能源光伏发电功率预测方法实施的基于变分模态分解与TPA-TCN网络的光伏功率预测方法,根据历史数据样本,通过信息处理模块生成训练样本,将该训练样本通过TPA-TCN预测模型,不断迭代训练,直到精度达到期望值,保留该模型。
(2)、该新能源光伏发电功率预测方法通过VMD分解降低时间序列的不稳定性与波动性,并且通过相似日法对相似的天气进行归类,从而能够使得神经网络更容易学习到其潜在规律。该方法基于时间模式注意力机制,能够充分提取多因素时序数列中之间的隐含关系,并给予TCN网络最合理的隐藏层权值,从而大大提高预测精度。
附图说明
图1为本发明新能源光伏发电功率预测方法流程图;
图2为本发明TPA-TCN预测模型图;
图3为本发明VMD分解流程图;
图4为本发明DBSCAN聚类算法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-4,本发明提供一种技术方案:一种新能源光伏发电功率预测方法,包括如下步骤:
S1:数据预处理:
将原始的光伏发电数据和气象数据导入,使用DBSCAN聚类算法进行异常筛选,然后补全缺失值和修正异常值;
使用DBSCAN聚类算法进行数据聚类,DBSCAN的聚类即为一个从密度可达关系延展出最大密度相连的集合,利用minPts和ε两个参数,将样本集分为核心点、边缘点和离群点三种;
其中在邻域半径内点的数量大于minPts的成为核心点,非核心点且在某个核心点邻域内的点成为边缘点,非以上两种类型的点被称为离群点,在进行合适的参数调整之后即可找到离群点,即为异常值;
假设样本集为D=(x1,x2,...,xn),使用DBSCAN进行密度描述的定义如下:
邻域:以选定目标为中心,半径为ε的区域即为该目标的邻域;
核心对象:若选定的目标指定邻域内的样本数量大于minPts,则称该对象为核心对象;
密度直达:在样本集D中,若点m在核心对象n的ε邻域内部,则称点m从点n直接密度可达;
密度可达:在样本集D中,对于xi和xj,若存在序列点p1,p2,...,pt,满足p1=xi,pt=xj,且pt+1可由pt密度直达,则称xj从xi密度可达;
密度相连:在样本集D中,若存在点o到点m和点n都密度可达,则称m、n密度相连;
非密度相连:没有密度相连关系的两个点,即为非密度相连关系;
通过样本值的均值、中位数进行异常数据的填充,通过异常数据cx周围的值c0,c1,...,c8来对其进行估算:
其中,权重ω与邻点和目标的距离成反比:
通过计算不同样本之间的距离,获得距离矩阵di={|ci-cx|}然后计算权重矩阵ω,最后通过下式计算估计值;
其中xi表示最近邻相应位置上的数值,K值通过交叉预测结果确定。
所述DBSCAN聚类算法的流程如下:
S1A:输入领域阈值Eps和密度阈值MinPts;
S2A:遍历数据集,标记处所有核心对象;
S3A:判断是否已被聚类标记,如被聚类标记则进入S2A,如未被聚类标记则进入S4A;
S4A:将某核心对象Eps邻域内的核心点集合,归为一类,并标记该核心点;
S5A:标记该核心点集合的Eps邻域内的核心点,并归为同一类;
S6A:遍历当前类所有核心对象,并标记;
S7A:判断遍历该聚类核心对象是否完成,如完成则进入S8A,如未完成则进入S5A;
S8A:聚类完成;
S9A:判断遍历数据集是否完成,如完成则进入S10A,如未完成则进入S2A;
S10A:输出所有聚类、核心点、边界点及离群点。
S2:气象因素筛选:
计算气象因素与其所对应的光伏发电功率的相关性系数,选择相关性系数较高的气象因素作为预测时的协变量;
S3:通过相似日算法,将原始数据集中的光伏功率数据以及其对应的气象因素建立相似日数据集;
相似日算法包括如下步骤:
S31:计算预测日和预测日所属天气类型的光伏发电功率历史数据集内所有样本有关其所有气象因素的曼哈顿距离:
其中di为所有气象因素之间的曼哈顿距离;n为气象因素个数;Yj为各个气象因素指标;Xij为与预测日天气雷翔相同的光伏发电功率历史数据集合中的第i个数据样本;m为该集合中的样本数目;
S32:选取D={d1,d2,d3,...,dm}中的最小值,该值对应的日期即为预测日的相似日。
S4:原始数据分解并计算模态分量与气象信息的相关度:
将光伏功率数据VMD分解,在分解过程中通过中心频率观察法确定VMD分解的模态数量,利用基于残差指标最小化的算法来确定VMD中的其他参数值,分解之后得到K个中心频率不同的模态分量,将得到的模态分量与气象因素使用Spearman系数和最大互信息系数对模态分量与气象因素之间关系进行评估;
将与气象因素相关度较高的模态分量重新整合成新的多维数据集,其他分量则保持原样,并将数据集划分成测试集和训练集;
所述VMD分解的参数确定方法包括如下步骤:
S41:VMD分解初始参数有模态数量K,惩罚因子α、收敛条件ε以及保真度系数τ,初始参数选择合适与否决定了数据分解质量;
其中模态分量K通过中心频率观察法确定,惩罚因子α、以及保真度系数τ通过残差指标最小化算法确定,收敛条件ε则取普遍值,即为ε=10-7;
S42:中心频率观察法即为从较小的K值开始选取,然后进行数据分解,观察其数据的中心频率,若中心频率有所重叠则增加K值,重复以上步骤,直到观察到不重叠且不相近的中心频率,此时K值即为后续实验所选取的K值;
残差指标最小化算法计算过程如下:
其中,N为待分解数列长度;x(t)为待分解数列;uk(t)表示取不同的惩罚因子α和保真度系数τ时产生的模态分量。
采用改进的混沌蝗虫优化算法对minREI函数求解,具体步骤为:
S421:根据VMD分解确定模态数量K;
S422:根据模态数量K,确定粒子即参数(α,τ)的位置,对原始信号进行VMD分解,计算分解出的模态分量适应度,保存全局最优位置;
S423:更新粒子的递减系数和位置信息,计算新的适应度,更新粒子的全局最优位置;
S424:利用混沌优化算法寻找全局最优解;
S425:重复步骤S423和步骤S424,直到满足条件,结束循环。
S5:输入模型进行运算:
将包含气象因素的数据集送入支持多变量预测的多维度TCN模型,得到隐藏状态向量Ht-w,Ht-w+1,...,Ht,并输入进TPA层,TPA层通过计算获得注意力向量vt,与隐藏状态向量进行线性映射相加后得到IMF2的预测值;
其余数据集则通过单维TCN网络进行预测;
将所有的输出结果求和重构,进行反归一化,得到预测值。
所述归一化处理为:
数据异常处理后,通过使数据集合矩阵D,/>经归一化处理后变为矩阵/>归一化处理后负荷数据值均在0~1之间,矩阵D为原始数据矩阵,矩阵DN为进行归一化处理后的数据矩阵;
其中,Dn,i为第n天第i时刻的光伏功率数据,表示第n天第i时刻的进行归一化处理后光伏功率数据,n∈[1,365]为一年中的天数,i∈[1,24]为一天中的小时数,min{D}为数据集最小值,max{D}为数据集最大值,max{D}-min{D}为数据集极值之差。
假设通过TCN网络产生的隐藏层信息为H={ht-ω,ht-ω+1,...,ht-1},其中ht为第t个时刻的隐藏层信息;ω则代表用于选取一定长度的时间数据的时间滑动窗口的长度;T表示时间注意力机制所关心的时间长度,一般情况下与窗口滑动长度相等;
使用k个卷积核,对原始隐藏层信息H进行卷积操作,产生一个n*k维的矩阵:
对于接下来预测的ht,通过其与之间的运算,计算出权重αi,其表示了/>中每行对于即将预测的ht的影响强度,即每个时间序列对于ht的影响大小,Wα∈Rk×m,计算过程如下:
其中,表示HC中第i行的向量;
然后进行加权求和,vt代表了所有行对于ht的综合影响,也就是时间方面的影响力:/>最后在运算中添加vt的因素,最终得到预测值:ht'=Whht+Wvvt。
需要说明的是,在发明的描述中,术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示对本发明结构的说明,仅是为了便于描述本发明的简便,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
对于本技术方案中的“第一”和“第二”,仅为对相同或相似结构,或者起相似功能的对应结构的称谓区分,不是对这些结构重要性的排列,也没有排序、或比较大小、或其他含义。
另外,除非另有明确的规定和限定,术语“安装”、“连接”应做广义理解,例如,连接可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个结构内部的连通。对于本领域的普通技术人员而言,可以根据本发明的总体思路,联系本方案上下文具体情况理解上述术语在本发明中的具体含义。
Claims (3)
1.一种新能源光伏发电功率预测方法,其特征在于:包括如下步骤:
S1:数据预处理:
将原始的光伏发电数据和气象数据导入,使用DBSCAN聚类算法进行异常筛选,然后补全缺失值和修正异常值;
使用DBSCAN聚类算法进行数据聚类,DBSCAN的聚类即为一个从密度可达关系延展出最大密度相连的集合,利用minPts和ε两个参数,将样本集分为核心点、边缘点和离群点三种;
其中在邻域半径内点的数量大于minPts的成为核心点,非核心点且在某个核心点邻域内的点成为边缘点,非以上两种类型的点被称为离群点,在进行合适的参数调整之后即可找到离群点,即为异常值;
假设样本集为D=(x1,x2,…,xn),使用DBSCAN进行密度描述的定义如下:
邻域:以选定目标为中心,半径为ε的区域即为该目标的邻域;
核心对象:若选定的目标指定邻域内的样本数量大于minPts,则称该对象为核心对象;
密度直达:在样本集D中,若点m在核心对象n的ε邻域内部,则称点m从点n直接密度可达;
密度可达:在样本集D中,对于xi和xj,若存在序列点p1,p2,…,pt,满足p1=xi,pt=xj,且pt+1可由pt密度直达,则称xj从xi密度可达;
密度相连:在样本集D中,若存在点o到点m和点n都密度可达,则称m、n密度相连;
非密度相连:没有密度相连关系的两个点,即为非密度相连关系;
通过样本值的均值、中位数进行异常数据的填充,通过异常数据cx周围的值c0,c1,…,c8来对其进行估算:
其中,权重ω与邻点和目标的距离成反比:
通过计算不同样本之间的距离,获得距离矩阵di={|ci-cx|},然后计算权重矩阵ω,最后通过下式计算估计值;
其中xi表示最近邻相应位置上的数值,K值通过交叉预测结果确定;
所述DBSCAN聚类算法的流程如下:
S1A:输入领域阈值Eps和密度阈值MinPts;
S2A:遍历数据集,标记处所有核心对象;
S3A:判断是否已被聚类标记,如被聚类标记则进入S2A,如未被聚类标记则进入S4A;
S4A:将某核心对象Eps邻域内的核心点集合,归为一类,并标记该核心点;
S5A:标记该核心点集合的Eps邻域内的核心点,并归为同一类;
S6A:遍历当前类所有核心对象,并标记;
S7A:判断遍历该聚类核心对象是否完成,如完成则进入S8A,如未完成则进入S5A;
S8A:聚类完成;
S9A:判断遍历数据集是否完成,如完成则进入S10A,如未完成则进入S2A;
S10A:输出所有聚类、核心点、边界点及离群点;
S2:气象因素筛选:
计算气象因素与其所对应的光伏发电功率的相关性系数,选择相关性系数较高的气象因素作为预测时的协变量;
S3:通过相似日算法,将原始数据集中的光伏功率数据以及其对应的气象因素建立相似日数据集;
S4:原始数据分解并计算模态分量与气象信息的相关度:
将光伏功率数据VMD分解,在分解过程中通过中心频率观察法确定VMD分解的模态数量,利用基于残差指标最小化的算法来确定VMD中的其他参数值,分解之后得到K个中心频率不同的模态分量,将得到的模态分量与气象因素使用Spearman系数和最大互信息系数对模态分量与气象因素之间关系进行评估;
将与气象因素相关度较高的模态分量重新整合成新的多维数据集,其他分量则保持原样,并将数据集划分成测试集和训练集;
所述VMD分解的参数确定方法包括如下步骤:
S41:VMD分解初始参数有模态数量K,惩罚因子α、收敛条件ε以及保真度系数τ,初始参数选择合适与否决定了数据分解质量;
其中模态分量K通过中心频率观察法确定,惩罚因子α、以及保真度系数τ通过残差指标最小化算法确定,收敛条件ε则取普遍值,即为ε=10-7;
S42:中心频率观察法即为从较小的K值开始选取,然后进行数据分解,观察其数据的中心频率,若中心频率有所重叠则增加K值,重复以上步骤,直到观察到不重叠且不相近的中心频率,此时K值即为后续实验所选取的K值;
残差指标最小化算法计算过程如下:
其中,N为待分解数列长度;x(t)为待分解数列;uk(t)表示取不同的惩罚因子α和保真度系数τ时产生的模态分量;
采用改进的混沌蝗虫优化算法对minREI函数求解,具体步骤为:
S421:根据VMD分解确定模态数量K;
S422:根据模态数量K,确定粒子即参数(α,τ)的位置,对原始信号进行VMD分解,计算分解出的模态分量适应度,保存全局最优位置;
S423:更新粒子的递减系数和位置信息,计算新的适应度,更新粒子的全局最优位置;
S424:利用混沌优化算法寻找全局最优解;
S425:重复步骤S423和步骤S424,直到满足条件,结束循环;
S5:输入模型进行运算:
将包含气象因素的数据集送入支持多变量预测的多维度TCN模型,得到隐藏状态向量Ht-w,Ht-w+1,…,Ht,并输入进TPA层,TPA层通过计算获得注意力向量vt,与隐藏状态向量进行线性映射相加后得到IMF2的预测值;
其余数据集则通过单维TCN网络进行预测;
假设通过TCN网络产生的隐藏层信息为H={ht-ω,ht-ω+1,…,ht-1},其中ht为第t个时刻的隐藏层信息;ω则代表用于选取一定长度的时间数据的时间滑动窗口的长度;T表示时间注意力机制所关心的时间长度,一般情况下与窗口滑动长度相等;
使用k个卷积核,对原始隐藏层信息H进行卷积操作,产生一个n*k维的矩阵:
对于接下来预测的ht,通过其与之间的运算,计算出权重αi,其表示了/>中每行对于即将预测的ht的影响强度,即每个时间序列对于ht的影响大小,Wα∈Rk×m,计算过程如下:
其中,表示HC中第i行的向量;
然后进行加权求和,vt代表了所有行对于ht的综合影响,也就是时间方面的影响力:最后在运算中添加vt的因素,最终得到预测值:h't=Whht+Wvvt;
将所有的输出结果求和重构,进行反归一化,得到预测值。
2.根据权利要求1所述的一种新能源光伏发电功率预测方法,其特征在于:所述归一化处理为:
数据异常处理后,通过使数据集合矩阵D,/>经归一化处理后变为矩阵/>归一化处理后负荷数据值均在0~1之间,矩阵D为原始数据矩阵,矩阵DN为进行归一化处理后的数据矩阵;
其中,Dn,i为第n天第i时刻的光伏功率数据,表示第n天第i时刻的进行归一化处理后光伏功率数据,n∈[1,365]为一年中的天数,i∈[1,24]为一天中的小时数,min{D}为数据集最小值,max{D}为数据集最大值,max{D}-min{D}为数据集极值之差。
3.根据权利要求1所述的一种新能源光伏发电功率预测方法,其特征在于:所述相似日算法包括如下步骤:
S31:计算预测日和预测日所属天气类型的光伏发电功率历史数据集内所有样本有关其所有气象因素的曼哈顿距离:
其中di为所有气象因素之间的曼哈顿距离;n为气象因素个数;Yj为各个气象因素指标;Xij为与预测日天气雷翔相同的光伏发电功率历史数据集合中的第i个数据样本;m为该集合中的样本数目;
S32:选取D={d1,d2,d3,...,dm}中的最小值,该值对应的日期即为预测日的相似日。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211014009.9A CN115310711B (zh) | 2022-08-23 | 2022-08-23 | 一种新能源光伏发电功率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211014009.9A CN115310711B (zh) | 2022-08-23 | 2022-08-23 | 一种新能源光伏发电功率预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115310711A CN115310711A (zh) | 2022-11-08 |
CN115310711B true CN115310711B (zh) | 2024-02-09 |
Family
ID=83864100
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211014009.9A Active CN115310711B (zh) | 2022-08-23 | 2022-08-23 | 一种新能源光伏发电功率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115310711B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116073436B (zh) * | 2023-04-06 | 2023-06-13 | 山东创宇环保科技有限公司 | 一种光伏新能源电力系统容量优化控制方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112348271A (zh) * | 2020-11-12 | 2021-02-09 | 华北电力大学 | 基于vmd-ipso-gru的短期光伏功率预测方法 |
AU2020104000A4 (en) * | 2020-12-10 | 2021-02-18 | Guangxi University | Short-term Load Forecasting Method Based on TCN and IPSO-LSSVM Combined Model |
-
2022
- 2022-08-23 CN CN202211014009.9A patent/CN115310711B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112348271A (zh) * | 2020-11-12 | 2021-02-09 | 华北电力大学 | 基于vmd-ipso-gru的短期光伏功率预测方法 |
AU2020104000A4 (en) * | 2020-12-10 | 2021-02-18 | Guangxi University | Short-term Load Forecasting Method Based on TCN and IPSO-LSSVM Combined Model |
Non-Patent Citations (4)
Title |
---|
基于AMD-ICSA-SVM的超短期风电功率组合预测;李燕青;袁燕舞;郭通;;电力系统保护与控制(第14期);正文第113-119页 * |
基于超短期风电功率预测的混合储能控制策略研究;李燕青;袁燕舞;郭通;王子睿;仝年;史依茗;;电测与仪表(第15期);正文第50-56页 * |
李燕青 ; 袁燕舞 ; 郭通 ; .基于AMD-ICSA-SVM的超短期风电功率组合预测.电力系统保护与控制.(第14期),正文第113-119页. * |
李燕青 ; 袁燕舞 ; 郭通 ; 王子睿 ; 仝年 ; 史依茗 ; .基于超短期风电功率预测的混合储能控制策略研究.电测与仪表.2017,(第15期),正文第50-56页. * |
Also Published As
Publication number | Publication date |
---|---|
CN115310711A (zh) | 2022-11-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Alamaniotis et al. | Evolutionary multiobjective optimization of kernel-based very-short-term load forecasting | |
CN110705760A (zh) | 一种基于深度置信网络的光伏发电功率预测方法 | |
Shimoyama et al. | Kriging-surrogate-based optimization considering expected hypervolume improvement in non-constrained many-objective test problems | |
CN111062512B (zh) | 一种风电功率预测方法 | |
CN111476677A (zh) | 一种基于大数据的用电类别售电量分析与预测方法及系统 | |
CN115310711B (zh) | 一种新能源光伏发电功率预测方法 | |
CN115496263A (zh) | 一种基于时空遗传注意力网络的短期光伏发电预测方法 | |
CN112464057A (zh) | 一种网络数据分类方法、装置、设备及可读存储介质 | |
CN114742203A (zh) | 基于混合机器学习方法的锂电池状态预测方法、系统和介质 | |
CN111008726A (zh) | 一种电力负荷预测中类图片转换方法 | |
CN117458480A (zh) | 基于改进lof的光伏发电功率短期预测方法及系统 | |
Cui et al. | Combined estimation of the parameters and states for a multivariable state‐space system in presence of colored noise | |
Ullah et al. | A novel technique of software cost estimation using flower pollination algorithm | |
Liu et al. | Bayesian hyperbolic multidimensional scaling | |
Cai et al. | Bhe-darts: Bilevel optimization based on hypergradient estimation for differentiable architecture search | |
Yin et al. | AutoML for Large Capacity Modeling of Meta's Ranking Systems | |
CN116663871A (zh) | 用电需求量预测方法及系统 | |
El Marghichi | A Solar PV Model Parameter Estimation Based on the Enhanced Self-Organization Maps | |
CN115292361A (zh) | 一种分布式能源异常数据的筛选方法及系统 | |
Qiu et al. | An Adaptive Reference Vector Adjustment Strategy and Improved Angle‐Penalized Value Method for RVEA | |
Pan et al. | Indoor positioning fingerprint database construction based on CSA-DBSCAN and RCVAE-GAN | |
CN116342077B (zh) | 一种适用于数据缺失场站的新能源功率迁移学习预测方法 | |
Gao et al. | On Solar Photovoltaic Parameter Estimation: Global Optimality Analysis and a Simple Efficient Differential Evolution Method | |
Jiang et al. | Ultra-short-term PV power forecasting based on FA-DELM model considering weather classification and VMD noise reduction | |
Gong et al. | Optimization of Leaky-ESN parameters based on dragonfly and whale algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |