CN117374941A - 一种基于神经网络的光伏发电功率预测方法 - Google Patents
一种基于神经网络的光伏发电功率预测方法 Download PDFInfo
- Publication number
- CN117374941A CN117374941A CN202311326715.1A CN202311326715A CN117374941A CN 117374941 A CN117374941 A CN 117374941A CN 202311326715 A CN202311326715 A CN 202311326715A CN 117374941 A CN117374941 A CN 117374941A
- Authority
- CN
- China
- Prior art keywords
- data
- algorithm
- learning machine
- extreme learning
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010248 power generation Methods 0.000 title claims abstract description 35
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 14
- 238000012549 training Methods 0.000 claims abstract description 23
- 238000005457 optimization Methods 0.000 claims abstract description 20
- 238000012360 testing method Methods 0.000 claims abstract description 10
- 238000012795 verification Methods 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 238000005070 sampling Methods 0.000 claims description 14
- 210000002569 neuron Anatomy 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 8
- 239000003016 pheromone Substances 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 claims description 2
- 230000004913 activation Effects 0.000 claims description 2
- 210000004027 cell Anatomy 0.000 claims description 2
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000010801 machine learning Methods 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 238000003915 air pollution Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000019637 foraging behavior Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/004—Generation forecast, e.g. methods or systems for forecasting future energy generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24143—Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2300/00—Systems for supplying or distributing electric power characterised by decentralized, dispersed, or local generation
- H02J2300/20—The dispersed energy generation being of renewable origin
- H02J2300/22—The renewable source being solar energy
- H02J2300/24—The renewable source being solar energy of photovoltaic origin
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Strategic Management (AREA)
- Evolutionary Biology (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Operations Research (AREA)
- Primary Health Care (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Power Engineering (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于神经网络的光伏发电功率预测方法,首先收集光伏发电站的各种数据;对所收集的数据进行清洗和转换预处理,并将处理后的数据划分为训练集、验证集和测试集;在原SMOTE算法的基础上引入距离阈值和密度阈值,对原SMOTE算法进行改进,然后利用改进后的SMOTE算法对所收集的数据进行样本扩充;通过融合蚁群优化算法和小生境算法对极限学习机模型进行优化,构建用于发电功率预测的极限学习机分类器;利用所构建的极限学习机分类器和数据集样本对实际光伏发电功率进行预测,分类结果为所预测发电功率的若干个区间。上述方法利用蚁群优化算法和小生境算法优化极限学习机分类器,可以有效地提高发电功率的预测精度。
Description
技术领域
本发明涉及光伏发电功率预测技术领域,尤其涉及一种基于神经网络的光伏发电功率预测方法。
背景技术
随着人类对环保问题的关注程度越来越高,可再生能源的利用受到了前所未有的关注。其中光伏发电作为一种清洁的、可再生的能源,己经在全球范围内得到了广泛的应用。然而光伏发电的功率产出受到许多因素的影响,如天气条件(包括太阳辐射、云覆盖、温度等)、季节和日照时间等,这些因素都会导致光伏发电的功率产出具有较大的不确定性。为了解决这个问题,需要准确预测光伏发电的功率,以便更好地规划和控制电力系统,提高电网的稳定性和运行效率。同时准确的功率预测也有助于提高光伏电站的经济效益,因为能源市场的参与者可以基于预测结果进行电力交易,避免因功率产出波动而带来的经济损失。
然而光伏发电功率预测是一个非常复杂的任务,首先影响光伏发电功率的因素多且互相影响,如天气条件、设备状态、地理位置等。这些因素构成了一个复杂的非线性系统,使得功率预测变得困难。其次光伏发电的数据通常具有噪声和缺失值,这也增加了预测的难度。此外光伏发电的数据通常是大规模的、高维的,对模型的计算能力和内存需求提出了较高的要求,而现有技术方案普遍存在预测精度不足、数据利用效率低、模型稳定性和泛化能力不足等问题。
发明内容
本发明的目的是提供一种基于神经网络的光伏发电功率预测方法,该方法利用蚁群优化算法和小生境算法优化极限学习机(ELM)分类器,可以有效地提高发电功率的预测精度。
本发明的目的是通过以下技术方案实现的:
一种基于神经网络的光伏发电功率预测方法,所述方法包括:
步骤1、首先收集光伏发电站的各种数据,所述数据包括天气数据、光伏电池板的电压、电流、功率数据;
步骤2、对所收集的数据进行清洗和转换预处理,并将处理后的数据按照一定比例划分为训练集、验证集和测试集,用于模型的训练、调优和测试;
步骤3、在原SM0TE算法的基础上引入距离阈值和密度阈值,对原SMOTE算法进行改进,然后利用改进后的SM0TE算法对所收集的数据进行样本扩充;
步骤4、通过融合蚁群优化算法和小生境算法对极限学习机模型进行优化,构建用于发电功率预测的极限学习机分类器;
步骤5、利用所构建的极限学习机分类器和步骤3中的数据集样本对实际光伏发电功率进行预测,分类结果为所预测发电功率的若干个区间。
由上述本发明提供的技术方案可以看出,上述方法利用蚁群优化算法和小生境算法优化极限学习机(ELM)分类器,可以有效地提高发电功率的预测精度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的基于神经网络的光伏发电功率预测方法流程示意图;
图2为本发明实施例所述极限学习机分类器的架构图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,这并不构成对本发明的限制。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
如图1所示为本发明实施例提供的基于神经网络的光伏发电功率预测方法流程示意图,所述方法包括:
步骤1、首先收集光伏发电站的各种数据,所述数据包括天气数据、光伏电池板的电压、电流、功率数据;
在该步骤中,所述天气数据的采集是通过气象局或气象传感器获取,包括温度、湿度、风速和日照时长数据;
所述光伏电池板的电压、电流、功率数据是通过连接传感器来获取,或者通过直接连接电表或逆变器进行采集;
其他数据的采集:如果需要考虑其他因素对光伏发电功率的影响,如云量、空气污染等,可以通过相应的传感器或监测设备进行采集。
步骤2、对所收集的数据进行清洗和转换预处理,并将处理后的数据按照一定比例划分为训练集、验证集和测试集,用于模型的训练、调优和测试;
在该步骤中,清洗预处理是对数据进行清理,去除无效数据、重复数据或异常数据;
转换预处理是对数据进行标准化、归一化处理,以更好地应用于机器学习算法中。
步骤3、在原SMOTE(Synthetic Minority Over-sampling Technique,合成少数类过采样技术)算法的基础上引入距离阈值和密度阈值,对原SMOTE算法进行改进,然后利用改进后的SMOTE算法对所收集的数据进行样本扩充;
在该步骤中,原SMOTE算法的过程为:假设有一个大小为N的原始数据集,每个数据点包含d个特征,原SMOTE算法的目标是生成k个合成样本,其中k是预先设定的参数,对于每个原始数据点,原SMOTE算法随机选择k个最近邻中的一个点,然后根据下式生成合成样本:xnew=xi+λC(xzi-xi)
其中xi是原始数据点;xzi是xi随机选择的最近邻;λC是一个0到1之间的随机数;
为了提高SMOTE算法的性能和可靠性,在原SMOTE算法的基础上引入了距离阈值和密度阈值,具体来说:
使用密度来定义样本的重要性,一个样本的密度越高,其重要性越大,将引入的距离阈值设为td,密度阈值设为ts,对于每个原始数据点xi,计算xi在d维空间中的k近邻,并计算其密度ρi:
其中dij是数据点xi和xj之间的欧氏距离;I(·)是指示函数,当括号中的条件成立时取值为1,否则为0;如果ρi>ts,则将数据点xi称为核心样本,否则称为边缘样本;
在生成新样本时,首先随机选择数据点xi的一个最近邻xzi,然后计算xi和xzi之间的距离dzi;如果dzi>td,则重新选择一个最近邻xzi;如果经过maxtties次重新选择最近邻后,仍然无法满足条件,则放弃生成新样本;其中,maxtries是预先设置的超参数;
为了保证新生成的样本不会影响到原始数据集中的边缘样本,引入了密度阈值ts,如果数据点xi是边缘样本,则只生成一个新样本;如果数据点xi是核心样本,则生成k个新样本,其中k由下式计算:
其中,γc是一个预先设定的参数,且1<γc<100,用于控制生成的新样本数量;int()为取整函数;
对于每个新样本,首先随机选择数据点xi的一个最近邻xzi,然后根据下式生成新样本:
xnew=xi+λu(xzi-xi)
其中λu是一个0到1之间的随机数;
如果生成的新样本xnew与数据点xi之间的距离dzc大于距离阈值td,则需要重新选择最近邻;如果经过maxtries次重新选择最近邻后,仍然找不到满足条件的最近邻,则放弃生成新样本;
其中,改进后的SMOTE算法还引入了一个新的参数maxdensity,用于控制在生成新样本时使用的密度阈值,具体来说:
首先计算所有原始数据点xi的密度ρi,并将其按照密度从大到小排序;然后选取密度排名前maxdensity的数据点作为核心样本;这样做的目的是保证生成的新样本更多地分布在密度较高的区域,从而提高算法的性能和可靠性;
在生成新样本时使用不同的密度阈值,具体使用下式计算新样本的密度阈值ts:
其中γp是预先设定的参数,且1<γp<N,N是原始数据集的大小。这样做的目的是使生成的新样本更加适应数据集的密度分布,从而提高算法的性能和可靠性。
通过以上改进,改进后的SMOTE算法能够更加准确地模拟原始数据集的密度分布,从而生成更加合理的新样本,同时还能够通过调整参数来控制生成的新样本数量,从而更好地满足实际应用的需求。
步骤4、通过融合蚁群优化算法和小生境算法对极限学习机模型进行优化,构建用于发电功率预测的极限学习机分类器;
在该步骤中,首先基于聚类的抽样策略优化极限学习机的输入训练数据,具体来说:
定义输入到极限学习机的数据集为T,其中样本数量是m,特征数量是n,使用k-means算法对数据集T进行聚类,聚类结果表示为:
S=k-means(T,K)
其中S={S1,S2,…,,SK}是聚类结果;K是聚类数量;
然后从每个聚类Sk中抽样p个样本,假设抽样比例为α,则p=α|Sk|,其中|Sk|是聚类Sk的样本数量;抽样结果为T′k=sample(Sk,p),其中T′k是从聚类Sk中抽样得到的样本集;组合抽样结果,得到优化后极限学习机的输入训练数据T′,表示为:
其中,Sk是第k个聚类;sample(Sk,p)是从聚类Sk中抽样p个样本得到的样本集;
使用T′代替T进行极限学习机的训练;
通过融合蚁群优化算法和小生境算法对极限学习机模型进行优化,蚁群优化算法是模拟自然界中蚁群觅食行为的元启发式优化算法,本发明用该算法选择极限学习机隐藏层神经元数量,具体是通过定义极限学习机隐藏层神经元数量为问题的解空间,每个蚂蚁根据信息素强度和启发信息在解空间中选择路径,每个路径对应一个隐藏层神经元数量,蚁群在解空间中搜索,信息素的浓度将根据分类性能的反馈进行更新,以引导搜索。
小生境算法是一种模拟生物个体在生存环境中寻找最适生存空间的元启发式算法,本发明用该算法优化极限学习机的输出层权重,具体是将极限学习机的输出层权重定义为问题的解空间,每个个体对应一组输出层权重;每个个体根据其适应度在解空间中搜索,适应度为极限学习机的分类性能,最适生存空间对应最优的输出层权重。
如图2所示为本发明实施例所述极限学习机分类器的架构图,包括输入层、隐藏层、输出层,基于该架构,融合蚁群优化算法和小生境算法对极限学习机模型进行优化的具体过程为:
1)初始化极限学习机的隐藏层权重矩阵W和偏置向量b
假设文本经过特征抽取后得到的特征矩阵为X,其中m是样本数量,n是特征数量;隐藏层神经元的数量是Ls,则隐藏层权重矩阵W和偏置向量b能随机初始化,表示为:
W=rand(n,Ls)b=rand(Ls)
2)使用蚁群优化算法选择隐藏层神经元数量
假设蚁群的大小为Na,则每只蚂蚁ai对应一个隐藏层神经元数量Li,Li初始化为随机值;每次迭代,每只蚂蚁根据信息素浓度和启发信息选择新的隐藏层神经元数量Li,并计算极限学习机的分类性能Pi,信息素浓度τ根据Pi更新:
其中ρ是信息素的挥发系数;δ(Li)是克罗内克函数,当Li是当前最优解时,δ(L′i)=1,否则为0;
3)利用小生境算法进行多目标优化,优化极限学习机的输出层权重
假设种群的大小为Np,则每个个体对应一组输出层权重βi,βi初始化为随机值;每次迭代,每个个体根据其适应度在解空间中搜索新的输出层权重β′i,并计算极限学习机的分类性能Pi′,个体的适应度fi根据Pi′更新:
fi=Pi′
最后选择适应度最高的输出层权重作为极限学习机的输出层权重;
4)自适应学习率调整
传统的极限学习机的学习过程通常使用固定的学习率,在一些情况下可能导致收敛速度慢或者困于局部最优解,因此本发明实施例提出一种自适应学习率的策略,用于根据模型的训练进度动态调整学习率,具体步骤如下:
首先初始化学习率η0和学习率衰减系数δ;在每次迭代开始时,计算当前迭代的学习率ηt:
使用ηt代替固定的学习率进行模型训练,对于极限学习机的权重更新公式,用ηt替换原来的学习率,表示为:
其中,βt是第t次迭代的权重;是损失函数L关于βt的梯度;
5)使用优化后的极限学习机进行文本分类
引入注意力机制,定义注意力权重为Wa,且wa由组成;隐藏层神经元的数量是Ls,ai是第i个隐藏层神经元的注意力权重;
输入特征矩阵X,计算隐藏层输出H:
H=σ(XW+b)
进一步计算注意力分数si:
其中ba是偏置;hi是H的第i列;tanh是激活函数;
再计算注意力权重ai:
用注意力权重ai调整隐藏层输出H,得到新的隐藏层输出H′:
H′=H⊙a
其中⊙是哈达玛积;
用新的隐藏层输出H′代替原来的H,计算输出层输出0:
O=H′β
其中β是输出层权重;0即为极限学习机的分类结果。
步骤5、利用所构建的极限学习机分类器和步骤3中的数据集样本对实际光伏发电功率进行预测,分类结果为所预测发电功率的若干个区间。
在该步骤中,向所构建的极限学习机分类器输入待预测的数据经过预处理和特征提取后的特征,所述极限学习机分类器输出实际光伏发电功率预测的各个区间,包括:
类别1:非常低功率,0-10%的最大功率范围;例如,如果最大功率是1000W,那么这个类别的范围就是0-100W;
类别2:低功率,10-30%的最大功率范围;
类别3:中等功率,30-60%的最大功率范围;
类别4:高功率,60-90%的最大功率范围;
类别5:非常高功率,90-100%的最大功率范围。
由上述方案可知,发电功率的预测结果被分为若干个区间,提高了预测的灵活性和实用性。
值得注意的是,本发明实施例中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
综上所述,本发明实施例所述方法具有如下优点:
1、提高预测精度:利用蚁群优化算法和小生境算法优化极限学习机(ELM)分类器,可以有效地提高发电功率的预测精度,蚁群优化算法被用于选择隐藏层神经元数量,而小生境算法被用于优化输出层权重;
2、提高数据利用率:在预处理阶段,通过采取K-means聚类和基于聚类的抽样策略,可以更有效地利用训练数据,提高模型的学习效率;
3、增强模型的稳定性和泛化能力:引入注意力机制和自适应学习率策略,可以提升模型的稳定性和泛化能力,提高模型在不同数据集上的表现。
另外,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,相应的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。本文背景技术部分公开的信息仅仅旨在加深对本发明的总体背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成己为本领域技术人员所公知的现有技术。
Claims (6)
1.一种基于神经网络的光伏发电功率预测方法,其特征在于,所述方法包括:
步骤1、首先收集光伏发电站的各种数据,所述数据包括天气数据、光伏电池板的电压、电流、功率数据;
步骤2、对所收集的数据进行清洗和转换预处理,并将处理后的数据按照一定比例划分为训练集、验证集和测试集,用于模型的训练、调优和测试;
步骤3、在原SMOTE算法的基础上引入距离阈值和密度阈值,对原SMOTE算法进行改进,然后利用改进后的SMOTE算法对所收集的数据进行样本扩充;
步骤4、通过融合蚁群优化算法和小生境算法对极限学习机模型进行优化,构建用于发电功率预测的极限学习机分类器;
步骤5、利用所构建的极限学习机分类器和步骤3中的数据集样本对实际光伏发电功率进行预测,分类结果为所预测发电功率的若干个区间。
2.根据权利要求1所述基于神经网络的光伏发电功率预测方法,其特征在于,在步骤1中,所述天气数据的采集是通过气象局或气象传感器获取,包括温度、湿度、风速和日照时长数据;
所述光伏电池板的电压、电流、功率数据是通过连接传感器来获取,或者通过直接连接电表或逆变器进行采集。
3.根据权利要求1所述基于神经网络的光伏发电功率预测方法,其特征在于,在步骤2中,清洗预处理是对数据进行清理,去除无效数据、重复数据或异常数据;
转换预处理是对数据进行标准化、归一化处理,以更好地应用于机器学习算法中。
4.根据权利要求1所述基于神经网络的光伏发电功率预测方法,其特征在于,在步骤3中,原SMOTE算法的过程为:假设有一个大小为N的原始数据集,每个数据点包含d个特征,原SMOTE算法的目标是生成k个合成样本,其中k是预先设定的参数,对于每个原始数据点,原SMOTE算法随机选择k个最近邻中的一个点,然后根据下式生成合成样本:
xnew=xi+λc(xzi-xi)
其中xi是原始数据点;xzi是xi随机选择的最近邻;λc是一个0到1之间的随机数;
在原SMOTE算法的基础上引入了距离阈值和密度阈值,具体来说:
使用密度来定义样本的重要性,一个样本的密度越高,其重要性越大,将引入的距离阈值设为td,密度阈值设为ts,对于每个原始数据点xi,计算xi在d维空间中的k近邻,并计算其密度ρi:
其中dij是数据点xi和xj之间的欧氏距离;I(·)是指示函数,当括号中的条件成立时取值为1,否则为0;如果ρi>ts,则将数据点xi称为核心样本,否则称为边缘样本;
在生成新样本时,首先随机选择数据点xi的一个最近邻xzi,然后计算xi和xzi之间的距离dzi;如果dzi>td,则重新选择一个最近邻xzi;如果经过maxtries次重新选择最近邻后,仍然无法满足条件,则放弃生成新样本;其中,maxtries是预先设置的超参数;
为了保证新生成的样本不会影响到原始数据集中的边缘样本,引入了密度阈值ts,如果数据点xi是边缘样本,则只生成一个新样本;如果数据点xi是核心样本,则生成k个新样本,其中k由下式计算:
其中,γc是一个预先设定的参数,且1<γc<100,用于控制生成的新样本数量;int()为取整函数;
对于每个新样本,首先随机选择数据点xi的一个最近邻xzi,然后根据下式生成新样本:
xnew=xi+λu(xzi-xi)
其中λu是一个0到1之间的随机数;
如果生成的新样本xnew与数据点xi之间的距离dzc大于距离阈值td,则需要重新选择最近邻;如果经过maxtries次重新选择最近邻后,仍然找不到满足条件的最近邻,则放弃生成新样本;
其中,改进后的SMOTE算法还引入了一个新的参数maxdensity,用于控制在生成新样本时使用的密度阈值,具体来说:
首先计算所有原始数据点xi的密度ρi,并将其按照密度从大到小排序;然后选取密度排名前maxdensity的数据点作为核心样本;
在生成新样本时使用不同的密度阈值,具体使用下式计算新样本的密度阈值ts:
其中γp是预先设定的参数,且1<γp<N,N是原始数据集的大小。
5.根据权利要求1所述基于神经网络的光伏发电功率预测方法,其特征在于,在步骤4中,首先基于聚类的抽样策略优化极限学习机的输入训练数据,具体来说:
定义输入到极限学习机的数据集为T,其中样本数量是m,特征数量是n,使用k-means算法对数据集T进行聚类,聚类结果表示为:
S=k-means(T,K)
其中S={S1,S2,...,SK}是聚类结果;K是聚类数量;
然后从每个聚类Sk中抽样p个样本,假设抽样比例为α,则p=α|Sk|,其中|Sk|是聚类Sk的样本数量;抽样结果为T′k=sample(Sk,p),其中T′k是从聚类Sk中抽样得到的样本集;组合抽样结果,得到优化后极限学习机的输入训练数据T′,表示为:
其中,Sk是第k个聚类;sample(Sk,p)是从聚类Sk中抽样p个样本得到的样本集;使用T′代替T进行极限学习机的训练;
并通过融合蚁群优化算法和小生境算法对极限学习机模型进行优化,具体来说:
1)初始化极限学习机的隐藏层权重矩阵W和偏置向量b
假设文本经过特征抽取后得到的特征矩阵为X,其中m是样本数量,n是特征数量;隐藏层神经元的数量是Ls,则隐藏层权重矩阵W和偏置向量b能随机初始化,表示为:
W=rand(n,Ls)b=rand(Ls)
2)使用蚁群优化算法选择隐藏层神经元数量
假设蚁群的大小为Na,则每只蚂蚁ai对应一个隐藏层神经元数量Li,Li初始化为随机值;每次迭代,每只蚂蚁根据信息素浓度和启发信息选择新的隐藏层神经元数量L′i,并计算极限学习机的分类性能Pi,信息素浓度τ根据Pi更新:
其中ρ是信息素的挥发系数;δ(L′i)是克罗内克函数,当L′i是当前最优解时,δ(L′i)=1,否则为0;
3)利用小生境算法进行多目标优化,优化极限学习机的输出层权重
假设种群的大小为Np,则每个个体对应一组输出层权重βi,βi初始化为随机值;每次迭代,每个个体根据其适应度在解空间中搜索新的输出层权重β′i,并计算极限学习机的分类性能Pi′,个体的适应度fi根据Pi′更新:
fi=Pi′
最后选择适应度最高的输出层权重作为极限学习机的输出层权重;
4)自适应学习率调整
所述自适应学习率调整是根据模型的训练进度动态调整学习率,具体步骤如下:
首先初始化学习率η0和学习率衰减系数δ;在每次迭代开始时,计算当前迭代的学习率ηt:
使用ηt代替固定的学习率进行模型训练,对于极限学习机的权重更新公式,用ηt替换原来的学习率,表示为:
其中,βt是第t次迭代的权重;是损失函数L关于βt的梯度;
5)使用优化后的极限学习机进行文本分类
引入注意力机制,定义注意力权重为Wa,且wa由组成;隐藏层神经元的数量是Ls,ai是第i个隐藏层神经元的注意力权重;
输入特征矩阵X,计算隐藏层输出H:
H=σ(XW+b)
进一步计算注意力分数si:
其中ba是偏置;hi是H的第i列;tanh是激活函数;
再计算注意力权重ai:
用注意力权重ai调整隐藏层输出H,得到新的隐藏层输出H′:
H′=H⊙a
其中⊙是哈达玛积;
用新的隐藏层输出H′代替原来的H,计算输出层输出O:
O=H′β
其中β是输出层权重;O即为极限学习机的分类结果。
6.根据权利要求1所述基于神经网络的光伏发电功率预测方法,其特征在于,在步骤5中,向所构建的极限学习机分类器输入待预测的数据经过预处理和特征提取后的特征,所述极限学习机分类器输出实际光伏发电功率预测的各个区间,包括:
类别1:非常低功率,0-10%的最大功率范围;
类别2:低功率,10-30%的最大功率范围;
类别3:中等功率,30-60%的最大功率范围;
类别4:高功率,60-90%的最大功率范围;
类别5:非常高功率,90-100%的最大功率范围。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311326715.1A CN117374941A (zh) | 2023-10-13 | 2023-10-13 | 一种基于神经网络的光伏发电功率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311326715.1A CN117374941A (zh) | 2023-10-13 | 2023-10-13 | 一种基于神经网络的光伏发电功率预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117374941A true CN117374941A (zh) | 2024-01-09 |
Family
ID=89392281
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311326715.1A Pending CN117374941A (zh) | 2023-10-13 | 2023-10-13 | 一种基于神经网络的光伏发电功率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117374941A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117974221A (zh) * | 2024-04-01 | 2024-05-03 | 国网江西省电力有限公司南昌供电分公司 | 基于人工智能的电动车充电站选址方法及系统 |
-
2023
- 2023-10-13 CN CN202311326715.1A patent/CN117374941A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117974221A (zh) * | 2024-04-01 | 2024-05-03 | 国网江西省电力有限公司南昌供电分公司 | 基于人工智能的电动车充电站选址方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shamshirband et al. | A survey of deep learning techniques: application in wind and solar energy resources | |
CN101414366B (zh) | 基于改进极端学习机方法的电力系统短期负荷预测方法 | |
CN112733462B (zh) | 一种结合气象因素的超短期风电场功率预测方法 | |
CN112116144B (zh) | 一种区域配电网短期负荷预测方法 | |
CN113282122B (zh) | 一种商用建筑能耗预测优化方法及系统 | |
CN112070262B (zh) | 一种基于支持向量机的空调负荷预测方法 | |
CN110674965A (zh) | 基于动态特征选取的多时间步长风功率预测方法 | |
CN113762387B (zh) | 一种基于混合模型预测的数据中心站多元负荷预测方法 | |
CN117374941A (zh) | 一种基于神经网络的光伏发电功率预测方法 | |
CN109242136A (zh) | 一种微电网风电功率混沌遗传-bp神经网络预测方法 | |
Shi et al. | Load forecasting for regional integrated energy system based on complementary ensemble empirical mode decomposition and multi-model fusion | |
CN116629428A (zh) | 一种基于特征选择和SSA-BiLSTM的建筑能耗预测方法 | |
CN116345555A (zh) | 一种基于cnn-isca-lstm模型的短期光伏发电功率预测方法 | |
CN115995810A (zh) | 一种考虑气象波动自适应匹配的风电功率预测方法及系统 | |
CN116702937A (zh) | 一种基于K-means均值聚类及优化BP神经网络的光伏出力日前预测方法 | |
CN114611757A (zh) | 基于遗传算法与改进深度残差网络的电力系统短期负荷预测方法 | |
Goh et al. | Hybrid SDS and WPT-IBBO-DNM Based Model for Ultra-short Term Photovoltaic Prediction | |
CN115481788B (zh) | 相变储能系统负荷预测方法及系统 | |
CN115392387B (zh) | 一种低压分布式光伏发电出力预测方法 | |
Khan et al. | A comparative study on solar power forecasting using ensemble learning | |
Tan et al. | Long-term load forecasting based on feature fusion and lightgbm | |
Subramanian | Performance comparison of modified elephant herding optimization tuned MPPT for PV based solar energy systems | |
Liu et al. | Short-term PV power prediction model based on weather feature clustering and Adaboost-GA-BP | |
CN111340291B (zh) | 一种基于云计算技术的中长期电力负荷组合预测系统及方法 | |
Hossain et al. | Cascading Neural Network with Particle Swarm Optimization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |